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内 容 简介 

本 书 是 天 津 市 普通 高 等 学 校本 科教 学 质量 与 教学 改革 研究 计划 项 目 “ 基 于 应 用 型 人 才 培养 
的 大 学 数学 综合 改革 与 实践 "( 津 教委 高 [2012]32 号 ) 的 研究 成 果 。 其 基本 内 容 是 依据 国家 非 数 
学 类 专业 数学 教学 指导 委员 会 分 委员 会 于 2005 年 提出 的 关于 “概率 论 与 数理 统计 "课程 教学 基 
本 要 求 确定 的 。 本 书 将 概率 统计 理论 和 世界 公认 的 标准 统计 软件 一 一 SPSS 软件 相 结 合 ,基于 
SPSS 软件 介绍 实际 应 用 ,易学 易 用 。 使 用 者 在 学 习 相 关 理 论 的 基础 上 ,可 以 轻松 完成 统计 计算 
和 分 析 , 实 现 理论 到 实践 的 转化 。 

全 书 分 为 8 章 ,内 容 包 括 随机 事件 及 其 概率 、 随 机 变量 及 其 分 布 .随机 向 量 及 其 分 布 . 随 机 
变量 的 数字 特征 ;统计 估 值 ,统计 检验 ,方差 与 协 方差 分 析 、 相 关 与 回归 分 析 , 以 及 20 个 演示 实 
验 。 其 特点 是 ,内 容 可 视 化 ,计算 软件 化 ,方法 现实 化 ,技能 突出 ,实用 性 强 。 

本 书 是 天 津 市 “十 二 五 "规划 教材 ,可 作为 高 等 学 校 非 数学 类 本 科 专 业 学 生 的 教材 ,也 可 作 
为 应 用 统计 工作 者 的 参考 书 。 
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随 着 科学 技术 的 迅猛 发 展 ,数量 分 析 已 渗透 到 各 个 领域 ,数学 的 重要 性 已 被 整 
个 社会 所 公认 ;由 于 计算 机 技术 的 广泛 普及 与 提高 ,许多 繁 难 的 计算 和 抽象 的 推理 
已 不 再 是 高 不 可 攀 ,数学 的 应 用 越 来 越 深入 ; 随 着 人 类 素质 的 不 断 提高 ,数学 素质 
教育 已 成 为 全 体 公民 的 必修 课 , 数 学 的 普及 越 来 越 广泛 。 为 适应 新 形势 的 发 展 和 
社会 的 需要 ,信息 技术 与 学 科 课程 整合 已 提 到 教育 教学 改革 “ 重 中 之 重 "的 地 位 , 运 
用 信息 技术 改造 和 优化 传统 学 科 内 容 是 培养 新 世纪 具有 创新 能 力 的 高 素质 人 才 的 
必然 要 求 。 

天 津 商 业 大 学 “大 学 数学 基础 课程 教学 团队 ”是 天 津 市 级 教学 团队 ,经 过 多 年 
的 教学 研究 和 实践 ,组 织 具 有 丰富 教学 经 验 的 第 一 线 教师 ,于 2009 年 编著 出 版 了 
《概率 统计 与 SPSS 应 用 》, 经 过 三 年 多 的 教学 实践 ,我 们 对 书 中 的 内 容 作 了 订正 和 
调整 , 现 奉献 给 大 家 。 

《概率 统计 与 SPSS 应 用 ) 是 天 津 市 普通 高 等 学 校本 科教 学 质量 与 教学 改革 研 
究 计 划 项 目 一 一 基于 应 用 型 人 才 培 养 的 大 学 数学 综合 改革 与 实践 ( 津 教委 高 
[2012]32 号 ) 的 成 果 ,是 天 津 市 "十 二 五 "规划 教材 。 

这 部 教材 力求 体现 如 下 特点 : 

第 一 ,以 实用 为 原则 ,“ 教 .学 、 做 " 融 为 一 体 ,内容 体 系 整体 优化 ,使 读者 实现 由 
知识 向 能 力 的 转化 ,比如 分 析 、 处 理 和 解决 复杂 问题 的 能 力 , 就 业 、 创 新 和 创业 能 力 

第 二 ,以 实际 为 背景 ,概念 阐述 简明 ,通俗 化 ,举例 贴近 生活 ,运用 多 媒体 技术 
使 内 容 直 观 化 .图 形 化 ,使 读者 消除 对 数学 的 陌生 感 .抽象 感 嫩 惧 感 ,激活 求知 欲 ， 
增强 学 好 数学 ,做 好 数学 的 信心 ,比如 常见 概率 分 布 、 抽 样 分 布 基本 定理 .置信 区 
间 ,两 类 错误 等 。 

第 三 ,以 计算 机 为 工具 ,传统 内 容 与 信息 技术 应 用 有 机 融合 ,注重 基本 知识 、 基 
本 思想 、 基 本 能 力 的 培养 ,对 繁 、 难 、 抽 象 的 内 容 , 充 分 利用 当今 极为 流行 的 SPSS 
软件 来 实现 ,比如 分 布 函 数值 的 计算 、 点 估计 、 区 间 估 计 假设 检验 .方差 分析 , 协 方 
差分 析 、 相 关 分 析 、 回 归 分 析 等 。 

总 之 ,本 书 融 入 软件 ,突出 技能 ,实用 性 强 。 内 容 可 视 化 ,您 不 再 被 抽象 而 烦 
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恼 ; 计 算 软 件 化 ,您 不 再 被 繁 难 而 困扰 ;方法 现实 化 ,您 不 再 被 无 用 而 大 学 。 

书 中 涉及 的 20 个 演示 实验 和 SPSS 数据 文件 均 可 在 “天 津 市 大 学 数学 精品 资 
源 网 "上 下 载 , 也 可 以 和 作者 联系 索取 ,E-mail:yuyil88@126. com, 

主编 于 义 良 教授 是 天 津 市 高 等 学 校 首届 教学 名 师 , 曾 到 澳大利亚 La Trobe 大 
学 学 习 考 察 , 亲 身 经 历 了 国外 大 学 数学 教育 对 学 生 能 力 、 素 质 培养 的 实践 ,他 们 特 
别 重视 数 学 思想 的 熏陶 和 数学 知识 的 应 用 ,“ 做 中 学 ,学 中 悟 , 悟 中 醒 , 醒 中 行 ”做 得 
非常 出 色 。 可 喜 的 是 本 书 恰好 在 这 方面 做 了 有 益 的 尝试 。 

天 津 市 教育 委员 会 高 教 处 ,西安 交通 大 学 出 版 社 对 该 项 目的 研究 给 予 了 热心 
的 指导 和 支持 ,在 此 一 并 致 以 最 诚挚 的 感谢 。 

我 们 期 盼 着 本 书 能 为 广大 读者 带 来 学 数学 的 轻松 ,做 数学 的 快乐 和 效率 。 


编 者 
2013. 05 
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第 1 章 随机 事件 及 其 概率 


生活 在 一 个 日 新 月 异 .千变万化 的 世界 中 ,每 个 人 时 刻 都 要 面 对 许 多 生活 中 碰 
到 的 问题 。 例 如 :“ 明 天 是 雨天 还 是 晴天 ,是 否 可 以 出 去 旅游 ”;“ 明 天 的 股市 是 上 涨 
还 是 下 跌 , 是 买 还 是 卖 ”";“ 下 个 月 某 空 调 器 的 销售 量 是 多 少 , 如 何 组 织 货源 ”;“ 今 年 
夏季 长 江 流域 的 降水 量 有 多 少 ,怎样 组 织 抗洪 ”";“ 在 下 届 奥 运 会 中 我 国体 育 健儿 能 
拿 多 少 金牌 ,如 何 争 取 金 牌 总 数 第 一 "等 等 ,这 些 问题 的 发 生 与 发 展 是 受 诸多 因素 
的 影响 ,因而 这 些 问题 的 结果 也 是 不 确定 的 ,不 可 预知 的 。 但 是 ,事实 证 明 在 许多 
不 确定 问题 中 隐藏 着 一 种 确定 性 的 规律 。 也 正 因为 如 此 ,人 类 才 在 不 断 摸索 和 研 
究 中 使 许多 以 前 认为 不 可 想象 的 问题 得 到 解决 ,人 类 才 取 得 了 如 此 辉煌 的 进步 。 
N. Weiner 说 ;“ 数 学 的 伟大 使 命 是 在 混沌 中 发 现 有 序 。” 

本 章 的 目的 就 是 从 基本 问题 出 发 ,引出 随机 事件 的 概念 ,试图 从 最 简单 的 随机 
现象 (偶然 现象 ) 中 去 探求 必然 的 规律 。 


1.1 随机 事件 


我 们 先 做 一 个 简单 的 试验 : 掷 一 颗 质地 均匀 的 货 子 ,观察 出 现 的 点 数 。 








BL annracsa 


显然 ,这 个 试验 具有 如 下 特点 : 

CD 在 相同 的 条 件 下 可 以 重复 进行 ; 

(2) 每 次 试验 的 可 能 结果 不 只 一 个 (出 现 1 点 ,出 现 2 点 ,…, 出 现 6 点 ), 而 究 
竟 出 现 哪个 结果 ,在 试验 之 前 不 能 预言 ; 

(3) 试验 之 前 可 以 预知 试验 中 一 切 可 能 的 结果 (六 种 结果 ) ,每 次 试验 中 出 现 
且 只 出 现 可 能 结果 中 的 一 个 。 

我 们 把 具有 上 述 三 个 特点 的 试验 称 为 随机 试验 (random experiment) ,简称 试 
验 (experiment) , 记 为 EE。 本 书 中 所 谈 的 试验 , 均 为 随机 试验 。 我们 就 是 研究 随机 
试验 中 这 些 可 能 结果 出 现 的 规律 。 


2 概率 统计 与 SPSS ER 


试验 中 的 每 个 可 能 的 结果 称 为 样本 点 (sample) ,用 w 表示 ,全 体 样本 点 构成 的 
空间 称 为 样本 空间 (sample space) ,用 0 表示 。 从 集合 论 的 观点 看 ,样本 空间 就 是 
针对 某 试验 的 所 有 可 能 结果 构成 的 全 集 , 而 样本 点 就 是 构成 样本 空间 的 元 素 。 样 
本 空间 2 的 子 集 称 为 随机 事件 (random event) ,简称 事件 (event) ,一 般 用 大 写字 母 
A,B,C,... 表示 。 我 们 称 一 事件 在 一 次 试验 中 出 现 ( 或 发 生 ) 了 ,是 指 该 次 试验 出 
现 的 结果 (样本 点 ) 属 于 该 事件 ( 子 集 ) ,否则 称 该 事件 没有 出 现 ( 或 发 生 )。 易 见 2 
在 每 次 试验 中 均 要 出 现 , 故 又 称 为 必然 事件 (certainty) 。g 在 每 次 试验 中 均 不 出 
现 , 故 称 为 不 可 能 事件 (impossible event)。 

dE Lii BET f oae rp ,我 们 设 

w TRIBUM) SBON EC 1. 2, 6) W w, 为 样本 点 , 且 记 AS li) s 

B=“ 出 现 的 点 数 是 2 或 者 3”; 

C=“ 出 现 的 点 数 大 于 1 小 于 5”; 

D=“ 出 现 的 点 数 是 偶数 ” 


则 样本 空间 为 : 
N = lans ws wss ws wss ws); 
B = {as an}; 
C = (os ois ois 
D = (ws ans ox) 
T AGS=1, 2, =, 6),B, C, D 均 为 事件 。 而 事件 “出 现 的 点 数 小 于 7” 是 


必定 要 出 现 的 , 它 就 是 一 个 必然 事件 。 实 际 上 它 包 括 了 所 有 的 样本 点 , 即 为 a= 
Van s we， wn， ans wss we}。 而 事件 “出 现 的 点 数 大 于 6" 是 不 可 能 出 现 的 , 它 就 是 一 
个 不 可 能 事件 。 实 际 上 它 不 包含 任何 样本 点 , 即 为 一 个 空 集 o. 

由 集合 和 随机 事件 之 间 的 关系 ,可 得 到 如 下 的 结论 。 

(D ACB:A 是 B 的 子 集 。 它 表示 若 事 件 A 出 现 , 则 事件 B 一 定 出 现 。 

(2)AUB( 或 A+B): A 与 B 的 并 (或 和 )。 它 表示 一 个 新 的 事件 , 即 事件 A 


和 事件 B 至 少 有 一 个 出 现 。 同样 事件 Ú A, AUR Ais Azs rn A, 这 n 个 事件 至 少 
有 一 个 出 现 。 

(3)ANB( 或 AB):A 与 B 的 交 ( 积 )。 它 表示 一 个 新 的 事件 , 即 事件 A 和 事件 
B 同时 出 现 。 同样 事件 A Ai RIR Ai, Azs ts An 这 个 事件 同时 出 现 。 

(4)ANB=G@: 它 表示 事件 A 和 事件 B 不 可 能 同时 出 现 ,我 们 称 A 与 B 为 互 
RAR, 简称 互 斥 (mutually exclusive events) 。 

(5)ANB=@ 且 AUB==Q: 它 表示 事件 A 和 事件 B 出 现 且 只 出 现 其 中 一 个 ， 
我 们 称 A B 为 对 立 , 并 称 B H AGR A X BO f 34 Sr 3 f£ (complementary 
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event) , 记 为 BAR A=B). 

(6)A 一 B:A 与 B 的 差 , 它 表示 事件 A 出 现 而 事件 B 不 出 现 。 显然 A 一 B= 
AB, 同 时 B—A—BA. 

(DAUB: EEIE A 和 事件 B 至 少 出 现 一 个 的 对 立 事件 。 显 然 它 表示 事件 
A 和 事件 B 都 不 出 现 , 即 4UB==ANB. 同样 U A, = À A. 

C8)ATTB: 它 是 事件 A 和 事件 B 同时 出 现 的 对 立 事件 。 显 然 它 表示 事件 A 和 
事件 B 至 少 有 一 个 不 出 现 , 即 A7T1B 一 AUB. FH Ô A = UA. 

下 面 我 们 用 图 形 (图 1. 1. 1) 将 上 面 的 结论 直观 地 显示 出 来 , 见 图 1. 1. 1。 





a EA 
«D -) 7 


% 
o 


A-B(ANB) AUB(ANB) ANB(A UB) 





图 1.1.1 


从 上 面 的 图 示 中 ,还 可 以 得 到 以 下 一 些 关系 : 
ANBCA; A—BCA, HA—B—A—AB-AB, ABCA; AB, AB 与 AB 
两 两 互 斥 ,4A=A4A5UAB, AUBCABUBAUAB-ABUB-BAUA-AU(B 


结合 前 面 的 试验 以 及 字母 w.(i 二 1, 2,，…, 6),B, C, D 表示 的 意义 ,我 们 有 
BCC; CUD= las « o «s ms) 

CND= (oi « ei) s B— bon w, wss ss 

CUD- loi » w} CYD— lon s ons wss on) 

C—-D—íw); | D—-C-le) 

大 家 还 可 以 验证 其 它 的 一 些 等 式 或 不 等 式 。 


4 概率 统计 与 SPSS 应 用 


以 上 一 些 表示 法 ,为 我 们 今后 处 理 某 些 复杂 事件 带 来 很 大 方便 。 
练习 1.1 


1. 将 一 枚 均匀 的 硬币 抛 两 次 ,事件 A, B,C 分别 表 示 “ 第 一 次 出 现 正面 ",“ 两 
次 出 现 同一 面 ",“ 至 少 有 一 次 出 现 正 面 "。 试 写 出 样本 空间 及 事件 A, B.C 中 的 
样本 点 。 

2. (EBORE BUB T BO TAS PEE A， B, C, D 分 别 表示 “点 数 之 和 为 偶数 ”， 
“点 数 之 和 小 于 5”,“ 点 数 相 等 ",“ 至 少 有 一 颗 角 子 的 点 数 为 3”。 试 写 出 样本 空间 
及 事件 AB, A+B, AC, BC, A 一 B 一 C 一 D 中 的 样本 点 。 

3. VLA. B,C 分 别 表示 某 城市 居民 订阅 日 报 、 晚 报 和 体育 报 。 试 用 A, B,C 


表示 以 下 事件 : 
(1) 只 订阅 日 报 ; (2) 只 订 日 报 和 晚报 ; 
(3) 只 订 一 种 报 ; (4) 正 好 订 两 种 报 ; 
(5) 至 少 订阅 一 种 报 ; (6) 不 订阅 任何 报 ; 
(7) 至 多 订阅 一 种 报 ; (8) 三 种 报纸 都 订阅 ; 


(9) 三 种 报纸 不 全 订阅 。 

4. 甲乙 、 丙 三 人 各 射击 一 次 ,事件 A, A A 分 别 表示 甲乙 、 丙 射 中 。 试 
说 明 下 列 事件 所 表示 的 结果 : A A; Ass AA, A FA, AA: As, Ai Ao 十 
AA, +AA; 

5. 设 事件 A，B, CWE ABCED RIE F IIHF ARN — E H AR A E RO ET: 
的 和 :4 十 B 十 C,AB 十 C,B 一 AC。 

6. 若 事 件 A, B,C 满足 A 十 C= 二 B 十 C, 试 问 A=B 是 否 成 立 ? 举例 说 明 。 

7. 对 于 事件 A,B,C, 试 问 A 一 (B 一 C) 二 (A 一 B) 十 C 是 否 成 立 ? 举例 说 明 。 


1.2 事件 的 概率 


下 面 再 回 到 原来 的 试验 : 掷 一 颗 质地 均匀 的 仍 子 ,观察 出 现 的 点 数 。 

显然 ,这 个 试验 具有 两 个 特点 : 

(1) 所 有 可 能 的 试验 结果 是 有 限 个 (有 限 性 ); 

(2) 每 个 可 能 结果 在 一 次 试验 中 出 现 的 可 能 性 相同 (等 可 能 性 ) 。 

我 们 把 具有 这 两 个 特点 的 试验 称 为 古典 概 型 (classical probability) o 

我 们 知道 在 每 次 试验 中 ,出 现 且 只 出 现 样本 空间 中 的 一 个 样本 点 。 所 谓 事件 
A 出 现 , 就 是 指 试验 出 现 事件 A 中 包含 的 样本 点 。 因 此 ,在 古典 概 型 中 由 于 样本 
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点 出 现 的 等 可 能 性 ,事件 A 出 现 的 可 能 性 大 小 就 可 以 用 事件 A 中 包含 的 样本 点 的 
个 数 占 样本 点 总 数 的 比例 来 度量 。 

定义 1.2.1 在 古典 概 型 中 , 设 样本 空间 Q 中 包含 有 n 个 样本 点 , 则 对 任意 事 
件 A, 若 A 中 含有 k 个 样本 点 ,那么 事件 A 的 概率 P(A) 定 义 为 


pup 二 事件 A 中 包含 的 样本 点 数 _ k 
样本 空间 0 中 样本 点 总 数 n 


在 搓 仍 子 的 试验 中 ,显然 有 





POD-L, i=1, 2,3, 4, 5, 6; P(B) 一 人 ; 
6 
mx s EE 
PQo- 3, Pa»-$, P(CUD)= 专 ， 
Pcnp-£, P( 了 一 全 Pq»-$-1, 
6 
LUND 
P(2)— 9 —0 


在 计算 古典 概 型 概率 中 ,往往 要 用 到 中 学 时 的 排列 与 组 合 的 知识 。 

例 1.2.1 箱 中 装 有 10 件 产品 ,其 中 1 件 是 次 品 ,在 9 件 合格 品 中 有 6 件 是 一 
等 品 ,3 件 二 等 品 。 现 从 箱 中 任 取 3 FE BOR CD 取得 3 件 产品 都 是 一 等 品 的 概率 ; 
@ 取得 3 件 产品 中 有 1 件 是 一 等 品 ,2 件 是 二 等 品 的 概率 ; @ 取得 3 件 产品 中 至 
DA 2 件 是 一 等 品 的 概率 。 

解 ”由 于 试验 中 是 任 取 3 件 ,所 以 这 个 试验 是 古典 概 型 。 每 个 样本 点 就 是 从 
10 件 中 任 取 3 件 产 品 构成 的 集合 ,与 顺序 无 关 , 故 样本 空间 中 样本 点 的 总 数 为 
Cioe 

(Q ER A-—"HIUMS 3 件 产品 都 是 一 等 品 ”, 那 么 A 中 的 样本 点 个 数 为 Ci ,所 以 





@ 设 B=“ 取 得 3 件 产品 中 有 1 件 是 一 等 品 ,2 件 是 二 等 品 ”, 那 么 B 中 的 样本 
点 个 数 为 Ci，。C3( 这 里 用 到 了 乘法 原理 ) ,所 以 








Ce 
图 设 C=“ 取 得 3 件 产品 中 至 少 有 2 件 是 一 等 品 ”, 那 么 事件 C 显然 是 由 有 2 
件 一 等 品 ,1 件 非 一 等 品 " 和 “3 件 都 是 一 等 品 * 两 个 事件 构成 ,所 以 C 中 的 样本 点 
个 数 为 Gi。 Ci 十 C3( 这 里 又 用 到 了 加 法 原理 ) ,那么 
CC +C 
Ci 
生活 中 还 有 很 多 问题 并 不 具有 古典 概 型 的 两 个 特点 ,例如 投掷 的 是 一 颗 不 均 


= =A 
P(O = 3 
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匀 的 仍 子 ,那么 样本 空间 中 的 6 个 样本 点 出 现 的 可 能 性 就 不 相等 了 ,因此 计算 其 中 
的 一 些 事件 的 概率 时 就 不 能 再 用 古典 概 型 的 公式 了 。 如 何 解决 这 类 问题 呢 ? 我 们 
最 常用 也 最 直接 的 办 法 就 是 反复 掷 这 颗 货 子 ( 例 如 做 了 ) 次 试验 ), 记 下 所 关心 的 


事件 A 在 这 次 试验 中 出 现 的 次 数 ( 例 如 出 现 了 jy 次 ), 比 值 符 ( 即 事件 A fEiX n 


次 试验 中 出 现 的 频数 ) 随 着 试验 次 数 ”的 增 大 而 越 来 越 接近 某 个 数值 p (这 被 称 为 
频率 的 稳定 性 ) ,那么 我 们 就 称 数 值 p 为 事件 A 的 概率 , 即 P(A) 二 p, 有 的 书 上 称 
此 为 事件 概率 的 统计 定义 . 但 是 数值 p 是 个 理论 上 的 数 ,在 有 限 次 的 试验 中 很 鸡 
求 得 。 一 般 就 用 条 作 为 P(A) 的 近似 值 , 即 PCAY e 

上 面 我 们 介绍 了 两 种 计算 随机 事件 概率 的 方法 。 实 际 上 由 于 问题 的 不 同 以 及 
处 理 问题 的 角度 不 同 ,还 有 许多 计算 随机 事件 概率 的 方法 ,但 是 不 管用 什么 方法 i 
算 概率 ,它们 都 要 求 具有 下 面 三 个 基本 性 质 : 

(1) 非 负 性 (nonnegativity ) 0 PCAO—1; 

(2) 规范 性 (normativity) : P(A) — 1. PC) —0; 

(3) 可 列 可 加 性 (additivity) ;车 A, Ci — 1. 2, …) 是 两 两 互 不 相 容 的 事件 ( 即 


AA,—0. i#j) W P CU A; = MPa ) 。 


以 上 :个 性 质 也 被 称 为 概率 的 公理 化 定义 (axiomatized definition) 。 即 对 任 
意 事件 A ,定义 实 函数 PCA) ,如 果 此 实 函 数 同 时 满足 上 述 三 个 性 质 (或 称 三 条 公 
HE) ,那么 就 称 P(A) 为 A 的 概率 。 

由 此 公理 化 定义 可 以 推出 以 下 一 些 性 质 : 

(1) ARE mHE) As Ass one AL 两 两 互 不 相 容 , 则 PC Ü A) = 


DPA); 
e 
(2) GEEASOPCD —-1— P(A); 
(3) (减法 公式 ) 若 A 七 B. 则 P(A 一 B)=P(A) 一 P(B); 
(4) (一 般 减 法 公式 )P(A 一 B)=P(AB)=P(A) 一 P(AB); 
(5) (一 般 加 法 公式 )p(AUB)=P(A) 十 P(B) 一 P(AB); 
(6) OKTE) PCAU B) PCA) - PCB) 
(7) (单调 不 减 性 ) 若 ADB, W P(A) 宇 P(B)。 
证 我 们 只 证 (2),(3),(5) ,其余 几 条 很 容易 推 得 (在 证 明 性 质 2 时 用 到 了 性 质 





(2) Bil Q—AUA. BEDA 1— P(Q2 — PFAUA — PCA) 十 PC , 故 P(A)=1 一 P(A)。 
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(3) HX ADB, A=(A—B)UB, XA (A—B)NB=9, FE P(A)= 
P[(A 一 B)UB]=P(A 一 B) 十 P(B), 故 P(A—B)=P(A)— P(B). 

(5) 因为 AUB=AU(B 一 AB), 而 AN(B 一 AB) 一 $B, 所 以 

P(A U B)= P[A U (B— AB) = P(A)+P(B—AB) 
= P(A) + P(B) — P(AB) 

通过 上 面 的 证 明 过 程 可 以 看 出 ,善于 把 一 个 事件 分 解 成 互 斥 事件 是 一 个 常用 
的 技巧 。 

例 1.2.2 假设 A 出现 的 概率 为 0.6,A 与 B 都 出 现 的 概率 为 0.1,A 与 B 都 
不 出 现 的 概率 为 0.15, 求 :D A 出 现 但 是 B 不 出 现 的 概率 ;@ A 与 B 至 少 出 现 一 
个 的 概率 。 

解 ” 依 题 意 P(A)=0.6, PCAB) —0.1, P(A B)=0.15, FÆ 

(D P(AB)=P(A—B)=P(A—AB)=P(A)—P(AB)=0. 5; 

© PKAUB) -1— PCAUB) -1— P(A B) —0.85, 


练习 1.2 


1 设 PCA)= 寺 ,PCB) 一 去, 试 就 以 下 三 种 情况 分 别 求 PCB2O 


oo| 一 


(DAB-9; (2)ACB; G)PCAB) — 


2. 已 知 PA) S PD - PO - 3. PLAO - PGBO - d PXAB) —0, RY 


fF A, B, C 全 不 发 生 的 概率 。 

3. 每 个 路 口 有 红 、 绿 、 黄 三 色 指 示 灯 ,假设 各 色 灯 的 开 闭 是 等 可 能 的 。 一 个 人 
骑 车 经 过 三 个 路 口 , 试 求 下 列 事件 的 概率 :4 一 “三 个 都 是 红 灯 ” 一 “全 红 ”; 了 3 一 “全 
绿 ”; C 二 “全 黄 ”;D 二 “无 红 ”; ESRR”; 下 一“ 三 次 颜色 相同 ”5G 一 “颜色 全 不 
相同 ”; H= "Bed". 

4. 设 一 批 产品 共 100 件 , 其 中 98 件 正品 ,2 件 次 品 , 从 中 任意 抽取 3 件 ( 分 三 
种 情况 :一 次 拿 3 件 ; 每 次 拿 1 件 , 取 后 放 回 拿 3 次 :每 次 拿 1 件 , 取 后 不 放 回 拿 3 
次 ), 试 求 

(OD 取出 的 3 件 中 恰 有 1 件 是 次 品 的 概率 ; 

(2) 取出 的 3 件 中 至 少 有 1 件 是 次 品 的 概率 。 

5. 从 0, 1, 2, …， 9 中 任意 选 出 3 个 不 同 的 数字 , 试 求 下 列 事件 的 概率 :A, 一 
{三 个 数字 中 不 含 0 与 5}, A, 二 {三 个 数字 中 不 含 0 或 5)。 

6. 从 0,1, 2,…,9 中 任意 选 出 4 个 不 同 的 数字 ,计算 它们 能 组 成 一 个 4 位 偶 
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数 的 概率 。 

7. 一 个 宿舍 中 住 有 6 位 同学 ,计算 下 列 事件 的 概率 : 

(1)6 人 中 至 少 有 1 人 生日 在 10 月份 的 概率 ; 

(2)6 APRA 4 人 生日 在 10 月份 的 概率 ; 

(3)6 APRA 4 人 生日 在 同一 月 份 的 概率 。 

8. 从 一 副 扑 克 牌 (52 张 ) 任 取 3 张 ( 不 重复 ), 计 算 取出 的 3 张 牌 中 至 少 有 2 张 
花色 相同 的 概率 。 


1.3 条 件 概 率 与 独立 性 及 其 应 用 


1. 条件 概率 


我 们 来 看 一 个 试验 : 箱 中 装 有 10 件 产品 ,其 中 2 件 次 品 ,8 件 正品 ,先后 有 2 
人 买 此 产品 ,每 人 1 件 , 甲 先 乙 后 。 

(1) 已 知 甲 买 走 1 件 正 品 (A) ,而 乙 在 该 箱 中 买 的 又 是 正品 (B)# 

(2) 已 知 甲 买 走 1 件 正 品 , 乙 要 求 另 开 1 箱 , 且 乙 买 的 也 是 正品 ; 

(3) 甲 急 急 忙 忙 买 走 1 件 产品 , 乙 在 该 箱 中 买 的 是 正品 。 

以 上 三 种 情况 的 结果 只 有 一 个 : 乙 买 走 了 正品 (B) ,但 由 于 前 提 条 件 不 同 , 因 
此 B 发 生 的 概率 也 就 不 同 。 

下 面 我 们 先 讨论 第 一 种 情况 。 

用 P(BIA) 来 表示 该 事件 的 概率 。 由 于 乙 在 买 产品 时 箱 中 有 9 件 产品 ,其 中 2 


件 次 品 ,7 件 正品 ,于 是 由 古典 概 型 的 公式 得 PCBLAY m T. 


我 们 再 进一步 讨论 这 个 问题 。 由 古典 概 型 的 公式 易 得 P(A)= 基 ,PCAB) 一 


Cie CŒ 8X7 


E P(AB)_7 
Ch*Cj 10X9’ 


那么 PCA) 一 了 





， 此 时 有 
P(AB) 
PA) 
事实 上 ,这 个 公式 有 普遍 的 意义 。 因 为 讨论 事件 (B1A) 时 是 在 事件 A 包含 的 
样本 点 内 考虑 事件 AB , 即 PCB1A) 是 在 缩小 了 的 样本 空间 A 中 讨论 的 。 
定义 1.3.1 对 于 两 个 事件 A 与 B, 如 果 P(A) 二 0, 称 


P(AB) 
P(A) 


为 事件 A 先 出 现 的 条 件 下 事件 B 后 出 现 的 条 件 概率 (conditional probability) 。 





P(B|A)= 


POBILAY= 
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当 A 二 Q 时 ,条 件 概率 P(BI2) 王 P(B)。 这 也 正 反映 了 条 件 概率 与 无 条 件 概 
率 之 间 的 区 别 与 联系 ,另外 P(AB) 与 P(B|A) 不 同 , P(AB) 是 在 0Q 中 考虑 AB 的 
(如 图 1.3. D. 

















P(BIA): 在 A 中 考虑 AB P(B): 在 0 中 考虑 B — P(AB): 在 .0 中 考虑 AB 
图 1.3.1 


在 计算 条 件 概率 时 ,一 般 有 两 种 方法 : 


P(AB) 
^ 一 
DARE, PBIA= 5A 


(2) 由 (B1A) 的 实际 意义 , 按 古 典 概 型 公式 直接 计算 。 

由 条 件 概 率 的 定义 很 容易 得 到 下 面 的 公式 : 

当 P(A)>0 时 , PCAB) — PCA) * PCB|AD 

当 P(B)>0 BE ,PCAB) — PCOD) * PCA| B s 

24 PCAB)0 ff, PCABO) — PCA) * P(B|A) + P(C|AB) 

以 上 公式 称 为 乘法 公式 (multiplication formula) 。 并 在 相应 条 件 成 立 情况 下 ， 
此 结论 可 推广 到 任意 有 限 个 。 即 当 PCA AA, 1)>0 时 ,有 

P(AA:…A,) 王 PCA)。P(A:14D)…P(A.|AA…A，) 
下 面 我 们 先 讨论 第 二 种 情况 。 
由 于 乙 要 求 另 开 一 箱 ,此 时 箱 中 仍 有 10 件 产品 ,其 中 2 件 次 品 ,8 件 正品 ,所 


以 PGIAY- d. 我 们 发 现 ,这 种 情况 下 乙 买 到 正品 (了 B) 的 概率 并 不 受 甲 是 否 买 





» PCA)>0. 


到 正品 (A) 的 影响 , 即 PGlAy-PO- E. 
由 乘法 公式 即 得 PCAB)—PCA) * P(B). 
2. 事件 的 独立 性 


定义 1.3.2 如 果 两 个 事件 A 与 忆 满足 等 式 
P(AB) — PCA) * P(B) 
称 事件 A 与 B 是 相互 独立 的 (mutually independent events) , 简称 A 与 B 独 立 
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(independent) o 
从 直观 上 讲 ,A 与 B 独立 就 是 其 中 任何 一 个 事件 出 现 的 概率 不 受 另 一 个 事件 
出 现 与 否 的 影响 。 
推论 1.3.1A 与 也 为 两 个 事件 , 当 P(B) 二 0 时 ,4A 与 也 独立 的 充分 必要 条 件 
是 
P(A|B) — PCA) 
当 PCA)0 时 ,A 与 B 独立 的 充分 必要 条 件 是 
P(GLA) — PCB) 
推论 1.3.2 设 A 与 B 为 两 个 事件 , 则 下 列 四 对 事件 :A 与 B;A 与 B;A SB; 
有 A 与 B 中 ,只 要 有 一 对 事件 独立 , 则 其 余 三 对 也 独立 。 
推论 1.3.1 的 证 明 很 容易 从 乘法 公式 中 推出 。 
下 面 只 证 推论 1. 3. 2 中 的 一 种 情况 ,其 它 情况 可 类 似 推出 。 
证 (不 妨 设 A 与 B 独立 ,我 们 证 A 与 B 也 独立 ) 
因为 4B=B 一 AB, 且 ABCB, 所 以 
P(AB)= P(B— AB) = P(B) — P(AB) 
= P(B) — P(A) » P(B) 
= P(B) + (1— P(A)) 
= P(Ā) - P(B) 





故 A 与 B 独立 。 

其 实 推论 1.3.2 的 证 明 也 可 以 这 样 思考 :首先 由 A 与 B 独立 ,证 A 与 B 也 独 
立 ;类 似 可 证 A 与 B 也 独立 ; 同 理由 A 与 B( 或 A 与 B) 独 立 , 可 证 A 与 B 独 立 ; 进 一 步 
由 A 与 B 独 立 , 可 证 A 与 B 独立 。 

判断 事件 的 独立 性 一 般 有 两 种 方法 : 

CD 由 定义 判断 ,是 否 满足 公式 ; 

(2) 由 问题 的 性 质 从 直观 上 去 判断 。 

以 上 关于 独立 性 的 概念 可 推广 到 任意 有 限 个 。 

定义 1.3.3 设 Al, A;,…, A, 为 n 个 事件 ,如 果 对 任何 正 整 数 m(2<m 声 
mU ER 1i mi mem Sn, BA 

P(A, A, A, )— PCA,) * PCA > PCA, ) 

称 事件 AL. Assn A, 是 相互 独立 。 

如 果 上 式 仅 对 m—2 成 立 , 则 称 事件 Ac. As. n. AL 两 两 独立 。 显 然 n 个 事 
件 (” 二 2) 的 相互 独立 性 和 两 两 独立 性 不 同 ,前 者 比 后 者 要 求 条 件 强 。 

PEDI E UE AL. Azs rs A, 相互 独立 ,就 是 指 它们 中 任何 一 个 事件 出 现 的 概 
率 不 受 其 余 某 一 个 或 几 个 事件 出 现 与 否 的 影响 。 这 个 事件 中 的 任何 部 分 事件 都 
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是 相互 独立 的 。A,，A:，…，A, 两 两 独立 ,就 是 指 这 个 事件 中 的 任何 两 个 事件 
是 相互 独立 的 。 显 然 ,由 事件 的 相互 独立 可 推出 事件 的 两 两 独立 ,但 反之 不 成 立 。 
例 1.3.1 设 甲 . 乙 、 丙 三 人 在 同一 时 间 内 破译 某 个 密码 ,而 甲乙 、 丙 三 人 单 
独 能 译 出 的 概率 分 别 为 0.8,0.7 和 0.6, 求 :密码 能 译 出 的 概率 ;@ 最 多 只 有 一 
人 能 译 出 的 概率 。 
解 ” 设 A="“ 甲 译 出 密码 ”,B,C 分 别 表示 乙 ` 丙 能 译 出 密码 ,D=“ 密 码 被 破 
译 ”, F=“ 最 多 只 有 一 人 译 出 ”。 依 实际 情况 ,A,B,C 相互 独立 , 则 
O P(D)=P(A+B+C) 
=P(A)+P(B)+P(C)—P(A)P(B)—P(A)P(C)—P(B)P(C)+ 
P(A)P(B)P(C) 
二 0. 8+0. 7+0. 6—0. 8X0. 7—0. 8X0. 6—0. 7X0. 6+ 
0.8X0.7X0.6 
—0. 976 
当然 还 可 以 这 样 做 
P(D)=P(ATBT+C)=P(AB C) 
=P(A) * P(B) * PCO) 
—(1—0.8) X (1—0. 7) X (1—0. 6) 


—0. 024 
故 
P(D) -1— PCD) —1— 0. 024—0. 976 
© 因为 F-ABC--ABC--ABC--A BC, 而 ABC, ABC, ABC, ABC 是 两 
Wi UJ BELA 


P(F)=P(A B C+AB C- AB C- A BC) 

—P(À B C)H-PXO LB C)+P(AB C) +P(A BO) 
—PCOD * P(B) * PCO +P(A) * P(B) * PCO + 
P(A) * P(B) * PCO  PCA) * P(B) * P(C) 

—0. 2X0. 3X0. 4+0. 8X0. 3X0. 44-0, 2X 0, 7X 0. 4 十 
0.2X0.3X0.6 
—0.212 


3. 应 用 


我 们 再 回去 讨论 前 面试 验 中 的 第 三 种 情况 。 
由 于 不 知道 甲 买 走 的 是 正品 还 是 次 品 , 这 就 增加 了 问题 的 难度 。 为 此 我 们 从 
实际 情况 出 发 ,全 面 考虑 问题 。 
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显然 ,B 二 BA 十 BA, 其 中 AA 一 $,A 十 A 一 Q, 那 么 
P(B)= P(BA +BA) 
= P(BA)+P(BA) 
= P(A)P(B| A) + PCAP | A) 


按照 上 面 处 理 问 题 的 思路 和 方法 ,可 以 得 出 下 面 两 个 很 重要 的 公式 ,它们 对 于 
计算 较为 复杂 的 事件 概率 是 很 有 用 的 。 
全 概率 公式 设 4 为 随机 试验 E 的 样本 空间 ,事件 组 Ai ，A:，…，A, 满足 
(DAA;—. ij s 
(D ÜA —0.P(0, i21, 2, s n. 
则 对 任 一 事件 B, 有 


P(B) = D)P(A,) . P(B| A). 
1 


这 个 公式 的 直观 意义 很 清楚 :把 复杂 事件 (直接 计算 其 概率 比较 难 )B 分 解 成 
两 两 互 斥 的 若干 个 简单 事件 (可 以 直接 计算 其 概率 ) 的 并 ( 见 图 1. 3. 2)。 





图 1.3.2 


其 中 B 为 黑色 圈 内 样本 点 的 集合 , 且 B—"B 中 互 不 相交 的 子 集 的 并 集 ”。 
证 PCE) — PCBO) - PLBCAi- A; A0] 
一 P(BA,) 十 P(BA:) 十 … 十 PCBA。) 
由 于 Ais Ass ons A, 两 两 互 斥 ,所 以 BA, BA:, ©, BA, 也 两 两 互 斥 ,再 由 
乘法 公式 可 得 





P(B) = >)P(BA,) = J, P(A) + P(B | A). 
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在 上 面 的 试验 中 ,如 果 再 增加 一 问 :已 知 乙 买 到 的 是 正品 ,那么 甲 买 到 正品 的 
概率 是 多 少 ? 这 显然 是 求 条 件 概率 P(A|B) ,由 条 件 概率 的 定义 及 乘法 公式 得 


P(AB) 


P(A | D= P(B) 





P(A) * P(B | A) 
P(A) - P(B | A) + P(A) - P(B | A) 





8 7 
lo* y 
8 7 2 8 
i0* s 10 9 


把 上 面 的 结论 推广 一 下 ,就 得 到 Bayes 公式 。 
Bayes 公式 设 0 为 随机 试验 EE 的 样本 空间 ,事件 组 A,，A:，…，A, 满足 
(DAA,=®,izj i 


(2) 口 A, 一 0,P(AD)>0，i1 2, =, n 
则 对 任 一 概率 不 为 零 的 事件 B, 有 
PA, | B) = PAD + P | AD 





ÈPAD + PG LAO 


在 用 上 面 全 概率 公式 和 Bayes 公 式 计算 时 ， 关键 是 找到 与 事件 B 有关 且 满足 
两 个 条 件 的 事件 组 A, ,A。,…，A,。 事件 组 ALS Anm A, 一 般 是 导致 事件 B 
出 现 的 因素 。 

例 1.3.2 每 箱 产品 有 10 件 , 其 中 的 次 品 数 从 0 到 2 是 等 可 能 的 。 开 箱 试验 
时 ,从 中 一 次 抽取 2 件 ( 不 重复 ), 如果 发 现 有 次 品 , 则 拒 收 该 箱 产品 。 试 计算 : 
中 一 箱 产品 通过 验收 的 概率 ;@ 已 知 该 箱 产品 通过 验收 , 则 该 箱 中 有 2 个 次 品 的 
概率 。 . 

B UL AL— RP iK” 170. 1, 2;B=“ 该 箱 产品 通过 验收 ”。 


BAA A A: WE AA SOG); DA 0; 





Pio. 1, 2), P(B|A)=1, 
-5 -G 
PGIAD- FGIAD =S 


O 由 全 概率 公式 ,有 
P(B)= P(AW)P(B | AO + PFCAOPCG | AD + P(A)P(B | A2) 
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1 
3*1 
© 由 Bayes 公式 ,有 





lx 
_ PAD .PCBI4) 3 
PG |B)— PD — 70.807 


下 面 看 一 个 较 复杂 一 点 的 关于 独立 性 的 试验 。 现 有 五 箱 产品 ,每 箱 中 均 有 10 
件 产品 ,其 中 3 件 次 品 ,7 件 正品 。 现 从 每 箱 中 均 任 取 1 件 产品 , 共 取 得 5 件 产品 ， 
我 们 研究 这 5 件 产品 中 正品 数 的 情况 。 

这 个 试验 是 由 5 次 基本 试验 (从 每 箱 中 任 取 1 件 产品 为 一 次 基本 试验 ) 构 成 ， 
它 显 然 有 以 下 特点 : 

OD. 每 次 基本 试验 中 只 有 两 个 结果 :正品 (A) ,次 品 (A); 


(2) 每 次 基本 试验 中 每 个 结果 出 现 的 概率 不 变 :PCA) m I. P= 


(3) 基本 试验 之 间 相 互 独立 ; 

(4) 在 相同 条 件 下 ,试验 可 以 重复 进行 。 

具有 以 上 四 个 特点 的 试验 称 为 独立 重复 试验 ,也 称 为 贝 努 里 (Bernoulli) 试验。 
若 该 试验 由 n 次 基本 事件 构成 ,就 称 为 n 重 贝 努 里 试验 。 上 面 的 试验 就 是 一 个 5 
重 贝 努 里 试验 。 这 种 概率 模型 在 理论 和 实践 方面 具有 重要 的 意义 。 

这 5 件 产品 中 正品 数 的 情况 如 何 呢 ? 我 们 研究 其 中 一 种 情况 。 令 B.—"5 件 
产品 中 恰 有 3 FIER". A=“ i 个 箱 中 取出 的 是 正品 ,i 二 1, 2, 34 4, 5; 

B=AiA:A;: A, A; +AA: Å; A As +H +A, Ā A; A, A; +e +A, AAA, A; 

即 B 分 解 为 若干 互 不 相 容 事件 的 并 。 这 并 中 到 底 有 多 少 事件 呢 ? 它 的 个 数 恰好 
为 从 5 个 元 素 中 任 取出 3 个 元 素 的 组 合 数 Ci 。 由 于 独立 性 及 PA), P(A) 的 不 


变 ,那么 这 Ci 个 事件 的 概率 相等 , 且 都 等 于 ( 主 ) - (6). pua 








pco = a/f) (i) 


根据 同样 的 思想 , 令 B, — "5 件 产品 中 恰 有 件 正品 ”,k 二 0, 1,2, 3. 4, 5, 那 
么 
PO, = e(iyG k —0,1,2,3, 4,5 
将 上 面 的 公式 推广 一 下 ,就 得 到 重要 的 贝 努 里 公式 。 


贝 努 里 公式 在 ” 重 贝 努 里 试验 中 ,如 果 事 件 A 在 每 次 试验 中 出 现 的 概率 为 








b 


少 有 
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B, 二 “在 nn 次 试验 中 事件 A 恰好 出 现 A 次 ”那么 
PG, = Ctp*(1= p)™ k—0.1,.2.-.n 
这 个 公式 在 下 一 章 还 要 用 到 。 
例 1.3.3 同时 掷 四 颗 均 匀 的 货 子 , 试 计算 :@D 恰 有 一 颗 是 6 点 的 概率 ;@ 至 
一 颗 是 6 点 的 概率 。 
解 ” 这 是 一 个 4 重 贝 努 里 试验 , 毛 每 一 颗 角 子 就 是 一 个 基本 试验 。 每 一 颗 贷 


子 "出 现 6 点 "(A) 的 概率 均 为 二 ,A 的 对 立 事件 “不 出 现 6 点 "(A) 的 概率 均 为 二 ， 


那么 


o Pa» -c()($) ; 
© B=* 至 少 有 一 颗 是 6 点 ”, 那 么 B 的 对 立 事件 为 B, ,所 以 


Pa» = 1 一 P(B) - 1- a (3) ($) 
当然 也 可 以 这 样 计算 (不 如 上 面 的 方法 简单 ) 


i 
P(B)— P(B, +B: +B, c B) = $) PB) 
ez 


3 o 





-e(s) ($) *e(s) (8) *eG) (8) +els) (8) 
下 面 再 看 一 道 例 题 , 要 分 清 不 同 试验 的 特点 。 
例 1.3.4 设 一 箱 中 装 有 a 件 正 品 和 4。 件 次 品 , 试 求 下 列 事件 的 概率 : 
O 有 放 回 地 取 3 次 ,每 次 1 件 ,取得 3 产品 依次 为 次 品 ,正品 ,次 品 ; 
Q 有 放 回 地 取 3 次 ,每 次 1 件 , 取 得 2 件 次 品 1 件 正品 ; 
@ 无 放 回 地 取 3 次 ,每 次 1 件 , 取 得 3 件 产 品 依次 为 次 品 、 正 品 、 次 品 ; 
Gp 无 放 回 地 取 3 次 ,每 次 1 件 , 取 得 2 件 次 品 1 件 正品 ; 
O 一 次 拿 3 件 产品 取得 2 件 次 品 1 件 正品 。 
解 〈 这 里 只 给 出 简略 解答 ,读者 试 作 详细 分 析 ) 

b a b ab? 


O 2 一 5 at atb (4b 


o »-6 (ss) C5): 




















a 
es aa 
b 5—1 a b a b—1 a 





Opcao arei atia ers oi ae a ad 
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a 
a 十 6 一 1 ”a 十 /一 2 
2 3ab(b—1) . 
(Gb b—0(T5—-2)! 
-QG _ 3ab(b—1) 
Qum Ci, (atb)(atb—1)(at+b—2) 


注意 最 后 两 个 事件 (4) 与 (5) 的 概率 相等 。 





练习 1.3 


1. 假设 一 批 产品 中 一 、 二 ,三 等 品 各 占 60%,30%,10%, 从 中 任 取 一 件 ,结果 
不 是 三 等 品 , 求 取 到 是 一 等 品 的 概率 。 

2. 设 10 件 产品 中 有 4 件 不 合格 品 , 从 中 任 取 2 件 , 已 知 所 取 2 件 产品 中 有 1 
件 不 合格 品 , 求 另 一 件 也 是 不 合格 品 的 概率 。 

3. 为 了 防止 意外 ,在 矿 内 同时 装 有 两 种 报警 系统 (ID) 和 (II) 。 两 种 报警 系统 单 
独 使 用 时 ,系统 (ID) 和 (II) 有 效 的 概率 分 别 为 0. 92 和 0. 93, 在 系统 (1) 失灵 的 条 件 
下 ,系统 (IID) 仍 有 效 的 概率 为 0. 85, 求 

(1) 两 种 报警 系统 (D) 和 (ID) 都 有 效 的 概率 ; 

(2) 系统 (ID) 失 灵 而 系统 (IL) 有 效 的 概率 

(3) 在 系统 (ID) 失 灵 的 条 件 下 ;系统 (D) 仍 有 效 的 概率 。 

4. 设 0<P(A) 一 11, 证明: 事件 A 与 B 独立 的 充 要 条 件 是 

P(B | A) = P(B | A) 
5. 设 事件 A 与 B 相互 独立 ,两 个 事件 只 有 A 发 生 的 概率 与 只 有 B 发 生 的 概 


率 都 是 十 , 求 PCA) 和 P(B). 


6. 证 明 : 若 P(A) 二 0,P(B) 二 0, 则 有 

(OD 当 A 与 B 独立 时 ,A 与 B 相 容 ; 

(2) 当 A 与 B 不 相 容 时 ,A 与 B 独立 。 

7. 已 知事 件 A, B,C 相互 独立 ,求证 :AUB 与 C 也 独立 。 

8. 甲 . 乙 ` 丙 三 台 机 床 独立 工作 ,在 同一 段 时 间 内 它们 不 需要 工人 照顾 的 概率 
分 别 为 0.7,0.8 和 0. 9, 求 在 这 段 时 间 内 ,最 多 只 有 一 台 机 床 需 要 人 照顾 的 概率 。 

9. 如 果 构 成 系统 的 每 个 元 件 能 正常 工作 的 概率 为 p( 称 为 元 件 的 可 靠 性 ) , 假 
设 元 件 能 否 正常 工作 是 相互 独立 的 ,分 析 下 面 各 系统 的 可 靠 性 。 
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10. 10 张 奖 券 中 含有 3 张 中 奖 的 奖券 ,每 人 购买 1 张 , 求 

COD 前 三 人 中 恰 有 一 人 中 奖 的 概率 ; 

(2) 第 二 人 中 奖 的 概率 。 

11. 在 肝癌 诊 断 中 ,有 一 种 甲 胎 蛋 白 法 ,用 这 种 方法 能 够 检查 出 的 肝癌 患者 中 
95% 为 真实 患者 ,但 也 有 可 能 将 10% 的 正常 人 误诊 。 根 据 以 往 的 记录 ,每 10000 
人 中 有 4 人 和 患 有 肝癌 , 试 求 : 

(1) 某 人 经 此 检验 法 诊断 患 有 肝癌 的 概率 ; 

(2) 已 知 某 人 经 此 检验 法 检验 患 有 肝癌 ,而 他 确实 是 肝癌 患者 的 概率 。 

12, 一 大 批 产 品 的 优质 品 率 为 30%% ,每 次 任 取 1 件 , 连 续 抽取 5 次 ,计算 下 列 
事件 的 概率 : 

CD 取 到 的 5 件 产 品 中 恰 有 2 件 是 优质 品 ; 

(2) 在 取 到 的 5 件 产品 中 已 发 现 有 1 件 是 优质 品 ,这 5 件 中 恰 有 2 件 是 优质 


a 
"ne 


13. 每 箱 产品 有 10 件 , 其 次 品 数 从 0 到 2 是 等 可 能 的 。 开 箱 检验 时 ,从 中 任 
取 1 件 ,如 果 检验 是 次 品 , 则 认为 该 箱 产品 不 合格 而 拒 收 。 假 设 由 于 检验 有 误 ,1 
件 正品 被 认为 是 次 品 的 概率 是 2% ,1 件 次 品 被 认为 是 正品 的 概率 是 5%, 试 计算 : 

(1) 抽 取 的 1 件 产 品 为 正品 的 概率 ; 

(2) 该 箱 产品 通过 验收 的 概率 。 

14. 假设 一 厂家 生产 的 仪器 ,以 概率 0. 70 可 以 直接 出 厂 ,以 概率 0. 30 需 进 一 
步调 试 ,经 调试 后 以 概率 0. 80 可 以 出 厂 ,并 以 概率 0. 20 定 为 不 合格 品 不 能 出 厂 。 
现 该 厂 新 生产 了 n(n 三 2) 台 仪器 (假设 各 台 仪 器 的 生产 过 程 相互 独立 ) R: 

(1) 全 部 能 出 厂 的 概率 ; 

(2) 其 中 恰 有 2 件 不 能 出 厂 的 概率 ; 

(3) 其 中 至 少 有 2 件 不 能 出 厂 的 概率 。 

15. 进行 一 系列 独立 试验 ,每 次 试验 成 功 的 概率 均 为 p, 试 求 以 下 事件 的 概 
率 : 
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(1) 直 到 第 -次 才 成 功 ; 

(2) 第 -次 成 功 之 前 恰 失 败 上 次 ; 

(3) 在 nn 次 中 取得 r (1 三 r<n) 次 成 功 ; 

(4) 直到 第 次 才 取 得 (1 三 r<n) 次 成 功 。 

16. 对 飞机 进行 3 次 独立 射击 ,第 一 次 射击 命中 率 为 0.4, 第 二 次 为 0. 5, 第 三 
次 为 0.7。 击 中 飞机 一 次 而 飞机 被 击落 的 概率 为 0.2, 击 中 飞机 两 次 而 飞机 被 击落 
的 概率 为 0.6, 若 被 击 中 三 次 , 则 飞机 必 被 击落 。 求 射击 三 次 飞机 被 击落 的 概率 。 
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前 面 我 们 只 是 用 初等 数学 的 方法 对 试验 中 单个 的 事件 进行 了 研究 。 而 试验 中 
的 事件 是 很 多 的 ,如 何 从 整体 上 把 握 这 个 试验 ,只 有 前 面 的 知识 是 远 远 不 够 的 。 为 
此 ,我 们 引入 随机 变量 。 


2.1 随机 变量 


我 们 知道 ,许多 试验 的 结果 都 是 用 数值 表示 。 例 如 , 掷 一 颗 骤 子 出 现 的 点 数 
为 :1,2,3,4,5,6; 一 箱 中 有 10 个 产品 ,其 中 3 个 次 品 ,7 个 正品 ,一 次 拿 5 个 产品 ， 
其 中 的 次 品 数 为 :0,1,2,3 等 等 。 它 们 有 一 个 共同 的 规律 , 即 不 同 的 结果 (样本 点 
对 应 不 同 的 数值 ,这 样 我们 就 自然 得 到 一 个 以 样本 点 (wo) 为 自 变 量 ,以 样本 空间 
(0) 为 定义 域 的 实 函数 。 

定义 2.1.1 设 巨 为 随机 试验 , 它 的 样本 空间 为 0 三 {w) ,如 果 对 于 每 一 个 。 
€ Q 均 有 实数 XX(w) 与 之 对 应 , 则 称 这 个 定义 在 Q 上 的 实 单 值 函 数 X(w) 为 随机 变 
fi (random variable) , 简 记 义 (w) 为 X. 

当然 ,有 些 试验 的 结果 不 具有 数量 的 含意 。 例 如 , 掷 一 枚 硬币 观察 出 现 正 、 反 
面 的 情况 。 但 我 们 可 以 引入 变量 按 下 列 规定 取 值 

X= 站 当 出现 正 面 时 
lo, 当 出 现 反面 时 

这 样 X 是 一 个 随机 变量 , 它 取 何 值 是 由 试验 结果 而 定 的 。 

在 上 面 的 掷 般 子 .抽检 产品 、 掷 硬币 等 试验 中 ,对 于 随机 变量 的 取 值 ,我 们 可 以 
按 一 定 的 顺序 一 一 列 出 ,这 样 的 随机 变量 称 为 离散 型 随机 变量 (discrete random 
variable) 。 

有 的 随机 变量 , 它 可 以 取 某 一 区 间或 某 几 个 区 间 内 的 一 切 值 ,不 可 能 一 一 列 
出 。 例 如 : 某 公 共 汽 车 每 隔 15 分 钟 来 一 辆 ,那么 某 乘客 在 车 站 的 候车 时 间 X 是 一 
个 随机 变量 , 它 可 以 取 区 间 [0,15] 内 的 一 切 值 。 某 一 自动 装置 的 使 用 寿命 X 是 一 
个 随机 变量 , 它 可 以 取 区 间 (0, 十 ce) 内 的 一 切 值 。 像 这 种 可 以 取 区 间 内 一 切 值 的 
随机 变量 称 为 连续 型 随机 变量 (continuous random variable) 。 
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此 外 , 若 X 是 一 个 随机 变量 ,那么 以 X 为 自 变量 构成 的 函数 了 二 了 (X) 也 是 随 


机 变量 , 称 Y 为 随机 变量 X 的 函数 。 例 如 ,由 于 各 种 因素 的 影响 ,一 个 球体 直径 的 
测量 值 D 是 一 个 随机 变量 ,那么 球体 的 体积 V 一 所 <( 旺 ) JE D ROC GEAR V 也 


是 随机 变量 。 
随机 变量 是 随机 事件 的 必然 延伸 与 升华 ,随机 事件 是 随机 变量 取 特定 值 时 的 


具体 体现 。 
2.2 离散 型 随机 变量 及 其 分 布 列 


撞 一 颗 均 匀 的 般 子 ,我 们 设 X 代表 出 现 的 点 数 , 则 X 可 能 取 到 的 值 为 :1,2,3， 
4,5,6。 由 古典 概率 可 知 ,X 取 各 值 的 概率 都 等 于 二 ,列表 如 下 ， 





























这 个 表 从 概率 的 角度 指出 了 随机 变量 在 随机 试验 中 取 值 的 分 布 状况 , 称 为 X 


的 概率 分 布 。 
一 般 地 , 设 离散 型 随机 变量 X 可 能 取 的 值 为 :zi，z，…，z，…。X 取 每 一 


个 值 c Gi—1, 2,…) 的 概率 PCX 一 zi) 一 户 , 则 称 下 表 





X ai z: 





P bi b: | m | bi | 











为 随机 变量 X 的 概率 分 布 (probability disribution ) ,也 称 为 X 834 15 31 ( distribu- 


tion series) , 
显然 ,概率 分 布 必须 满足 下 列 两 个 条 件 : 
(1)0<p;<1 i1—1,2, 


(2) Ea eu. 
TER A ri EREHE: HERK abo 
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Pa<X<b= b 


3k FE ,我 们 一 旦 有 了 随机 变量 X 的 概率 分 布 , 就 可 以 求 得 该 随机 变量 X 所 代 
表 的 随机 试验 中 任何 事件 的 概率 ,从 而 对 整个 试验 了 如 指 掌 。 
例如 在 掷 货 子 的 试验 中 


P2<X<5 = PX =39+PX=4)+PX=5) = 4, 
P 2< X<3.5) = PIX = D +P = 2) = 
不 同 的 随机 试验 对 应 着 不 同 的 概率 分 布 , 下 面 我 们 介绍 三 种 常见 的 离散 型 随 
机 变量 的 概率 分 布 。 


l. 两 点 分 布 
定义 2.2.1 如 果 随 机 变量 X 的 概率 分 布 为 
P(X=1)=p; P(X-0-—1—p-q (0 —p-—D 


则 称 X 服从 两 点 分 布 (two-point distribution) ,也 称 0 - 1 4* 25 (0 - 1 distribution) 。 

两 点 分 布 指 的 是 一 般 只 有 两 个 结果 的 试验 。 例 如 掷 硬币 只 有 正面 和 反面 , 检 
查 产 品 只 有 正品 和 次 品 , 出 生 小 孩 只 有 男孩 和 女孩 ,神经 细胞 只 有 抑制 和 兴奋 , 系 
统 电路 只 有 通 和 不 通 ……。 


2. 二 项 分 布 
定义 2.2.2 如 果 随 机 变量 X 的 概率 分 布 为 
P(X = k) = Cip'q"* k=0. 1,2, sn 


Hopo-pcl.q—1— p. WEK X 服从 参数 为 n,p 的 二 项 分 布 (two-term distrbu- 
tion) , 记 为 X~B(n, p). 

nn 重 贝 努 里 试验 正 是 二 项 分 布 的 试验 背景 。 一 个 篮球 运动 员 在 100 次 投篮 中 
投 中 的 次 数 ,n 台 相互 独立 的 同型 号 的 设备 同时 开动 时 出 现 故 障 的 设备 数 ,产品 检 
验 中 抽 得 的 次 品 数 等 等 ,都 是 二 项 分 布 模型 的 具体 化 。 两 点 分 布 是 二 项 分 布 的 特 
殊 情 况 。 








BL 二 项 分 布 演示 实验 
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3. 泊 松 分 布 


定义 2.2.3 如 果 随 机 变量 X 的 概率 分 布 为 


: 
PX =b) = Ae? —0,1,2, =, A>0 


则 称 X 服从 参数 为 4 的 泊 松 分 布 (Poisson distrbution) , 记 为 X~ PA). 

在 实际 中 ,有 很 多 * 排 队 ” 问 题 都 可 以 近似 地 用 泊 松 分 布 来 描绘 。 如 某 段 时 间 
内 候车 室内 旅客 人 数 ; 电 话 交 换 台 接 到 的 呼叫 次 数 ;放射 性 分 裂 落 到 一 个 区 域内 的 
质点 数目 等 等 ,都 近似 地 服从 泊 松 分 布 。 


Bb 泊 松 分 布 演示 实验 


容易 验证 ,以 上 三 种 分 布 均 满 足 概率 分 布 的 两 个 必要 条 件 ( 读 者 可 自行 验证 ) 。 
可 以 证 明 ( 称 为 泊 松 定理 ), 当 很 大 ,p 很 小 ,4 二 np 是 一 个 不 太 大 的 常数 时 ， 
可 以 用 泊 松 分 布 做 为 二 项 分 布 的 近似 , 即 
» àt 


Cpa -— p) ad Td k—0,1,2,-,n 
PB 泊 松 定理 演示 实验 


例 2.2.1 某 射手 有 5 发 子弹 ,每 射 一 次 命中 的 概率 为 0. 9, 如 果 命 中 了 就 停 
止 射 击 ,否则 一 直射 到 子弹 用 尽 为 止 , 求 耗 用 子弹 数 X 的 概率 分 布 。 
解 XX 的 所 有 可 能 取 值 为 :1,2,3,4,5。 
P(X—1)—0.9, 
P(X—2)—0.1X0.9—0.09, 
P(X=3)=0. 1? X0. 9—0. 009, 
P(X=4)=0. 1* X0. 9—0. 0009, 
P(X=5)=0. 1* X0. 9+0. 1* —0.0001, 
列表 表示 为 : 





X 1 | 2 3 4 5 














T 
P 0.9 0. 09 0. 009 0. 0009 | 0. 0001 
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当然 也 可 以 这 样 计 算 POX — 5) Bl 
P(X=5)=1—P(X=1)—P(X=2)—P(X=3)—P(X=4) 

例 2.2.2 某 车 间 有 5 台 同 型 号 的 机 床 , 每 台 机 床 配备 的 电动 机 功率 为 10 千 
瓦 。 已 知 每 台 机 床 工作 时 平均 每 小 时 实际 开动 20 分 钟 , 且 开 动 与 否 是 相互 独立 
的 。 现 因 电力 供应 紧张 ,供电 部 门 仅 提供 30 千瓦 的 电力 给 这 5 台 机 床 , 问 这 5 台 
机 床 能 正常 工作 的 概率 有 多 大 ? 

解 ” 设 A=“ 机 床 在 实际 开动 ”,X=“ 同 时 实际 开动 的 机 床 总 数 ”, 则 PCA) = 


地 ,上 且 XX 服 从 一 5,p 一 记 的 二 项 分 布 。 由 于 每 台电 动机 的 功率 为 10 千瓦 ,所 以 


同时 开动 的 车 床 数 不 能 超过 3 各 一 3 台 。 故 所 求 概率 为 
P(XS<W)=P(X=0+P(X=1)+P(X=2)+P(X= 3) 
os 1,94 Pe 
-e(5) 8) *e(5) 8) +G(33) (3) 


+G(3) (3) =i 





a~ 0.95 
下 面 我 们 通过 一 个 例子 说 明 怎样 求 离散 型 随机 变量 函数 的 分 布 列 。 
例 2.2.3 设 X 的 概率 分 布 为 


X ag 0 1 2 





Sle 


2 1 
d | 5 | * | 10 | 





ODXY— X —1 的 概率 分 布 ; (CDY — X* 的 概率 分 布 。 
解 (1) 由 Y= 二 X 一 1 可知 Y 的 所 有 可 能 取 值 为 :一 2, 一 1,0,1, 且 


PY--nD-PQO--D-i py--p-Pa-0-2, 


le 


=0=P(X=1)=} -p-2Pa-2- 
P(Y=0=P(X=D) =p’ P(Y—-D-PGOC—-2) 10 


A Y-—X—1 的 概率 分 布 为 





Y xi —1 0 





1 2 1 3 
5 5 5 10 10 
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(Fi 8E Y — X* 的 概率 分 布 为 

















Y 0 | 1 4 
2 3 3 
» 5 10 10 


d.3 


10 10* 


其 中 P(Y=D=P(X=-D+P(X=1)= 吉 + 
练习 2.2 


1. 设 XX 为 随机 变量 , 且 POCO 一 去 ,==1，2，…, 则 


COD 判断 上 面 的 式 子 是 否 为 X 的 概率 分 布 ; 

(2) 若是 , 试 求 PCX 为 偶数 ) 和 PS5). 

2. 已 知 Paco - Qr. i k=l, 2, =, H A>0, RC. 

3. 设 一 次 试验 成 功 的 概率 为 p(0 二 p 二 1) ,不 断 进行 重复 试验 ,直到 首次 成 功 
为 止 。 用 随机 变量 X 表示 试验 的 次 数 , 求 X 的 概率 分 布 。 

4. 设 自动 生产 线 在 调整 以 后 出 现 废品 的 概率 为 p, 当 生产 过 程 中 出 现 废 品 时 
立即 进行 调整 ,代表 在 两 次 调整 之 间 生 产 的 合格 品 数 , 试 求 

(1)X 的 概率 分 布 ; (2) PCX 二 5)。 

5. 一 张 考卷 上 有 5 道 选 择 题 ,每 道 题 列 出 4 个 可 能 答案 ,其 中 有 一 个 答案 是 
正确 的 。 求 某 学 生 靠 猜测 能 答对 至 少 4 道 题 的 概率 是 多 少 ? 

6. 为 了 保证 设备 正常 工作 ,需要 配备 适当 数量 的 维修 人 员 。 根 据 经 验 每 台 设 
备 发 生 故障 的 概率 为 0.01, 各 台 设 备 工 作 情况 相互 独立 。 

(1) 若 由 1 人 负责 维修 20 台 设 备 , 求 设备 发 生 故 障 后 不 能 及 时 维修 的 概率 ; 

(2) 设 有 设备 100 台 ,1 台 发 生 故 障 由 1 人 处 理 , 问 至 少 需 配备 多 少 维修 人 员 ， 
才能 保证 设备 发 生 故 障 而 不 能 及 时 维修 的 概率 不 超过 0. 01? 

7. 设 随机 变量 X 服从 参数 为 4 的 Poisson 分 布 . 且 POC- 0) — T oR 

(DA; (2D P(X>1). 

8. 设 书籍 上 每 页 的 印刷 错误 服从 Poisson 分 布 。 经 统计 发 现在 某 本 书 上 ,有 


一 个 印刷 错误 与 有 两 个 印刷 错误 的 页 数 相同 , 求 任意 检验 4 页 ,每 页 上 都 没有 印刷 
错误 的 概率 。 
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9. 在 长 度 为 上 的 时 间 间 隔 内 , 某 急 救 中 心 收 到 紧急 呼救 的 次 数 X 服从 参数 为 
aste 的 Poisson 分 布 ,而 与 时 间 间 隔 的 起 点 无 关 ( 时 间 以 小 时 计 ) , 求 


(1) 某 一 天 从 中 午 12 时 至 下 午 3 时 没有 收 到 紧急 呼救 的 概率 ; 
(2) 某 一 天 从 中 午 12 时 至 下 午 5 时 至 少 收 到 1 次 紧急 呼救 的 概率 。 
10. 已 知 X 的 概率 分 布 为 : 





X | 一 2 =f | 0 | 1 | 2 | 3 





1 


P 2a 10 





WRA) a; ODY — X* —1 的 概率 分 布 。 


2.3 连续 型 随机 变量 及 其 密度 


由 于 连续 型 随机 变量 的 取 值 充 满 一 个 或 若干 个 有 限 或 无 限 区 间 , 它 的 取 值 不 
可 能 一 一 列 出 ,再 用 前 面 概率 分 布 表 的 方法 去 描述 连续 型 随机 变量 显然 是 不 可 能 
的 。 下 面 我 们 通过 一 个 例子 找 出 解决 这 个 问题 的 最 基本 最 原始 的 方法 。 

某 厂 生产 某 产 品 的 规定 尺寸 为 25. 40 mm 已 知 这 批 产品 的 最 小 尺寸 为 
25.20 mm, 最 大 尺寸 为 20. 60 mm。 现 从 这 批 产品 中 任 取 一 产品 ,该 产品 的 尺寸 可 
看 作 连 续 型 随机 变量 X, 它 的 取 值 范围 为 区 间 [25. 20,25. 60]。 现 从 这 批 产品 中 任 
取 100 件 , 经 测量 就 得 到 100 个 测量 值 。 运 用 中 学 中 有 关 的 统计 知识 ,可 得 到 这 
100 个 数据 的 频率 分 布 表 ( 如 表 2. 3. 1) 和 频率 分 布 直方 图 (如 图 2. 3. 1)。 


表 2.3.1 频率 分 布 表 


























分 组 频数 频率 累计 频率 
25. 235 一 25. 265 1 0.01 0.01 
25. 265—25. 295 2 0.02 0.03 
25. 295—25. 325 5 0.05 0.08 
25. 325—25. 355 12 0.12 0.20 
25. 355—25. 385 18 0.18 0.38 
25. 385—25. 415 25 0.25 0.63 
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续 表 2.3.1 

分 组 频数 频率 累计 频率 
25. 415 一 25. 445 16 0.16 0. 79 
25.445—25. 475 13 0.13 0.92 
25.475— 25. 505 4 0.04 0. 96 
25. 505 一 25. 535 2 0.02 0.98 
25. 535~25. 565 2 0.02 1.00 

合 计 100 1.00 


频率 
组 距 


产品 和 
25.235 25.565 尺寸 /mm 


图 2.3.1 
我 们 知道 ,频率 是 概率 的 近似 值 ,每 个 小 矩形 的 高 低 反映 了 随机 变量 X 取 值 
在 各 个 小 区 间 内 的 概率 大 小 。 随 着 所 抽取 的 产品 个 数 的 增 大 和 所 分 数组 的 增 
加 ,图 中 所 表示 的 频率 就 越 接近 于 X 在 各 小 区 间 ( 越 来 越 小 ) 内 取 值 的 概率 。 由 极 
限 的 知识 可 知 , 当 无 限 增 大 ,分 组 的 组 距 无 限 缩小 ,频率 分 布 的 直方 图 就 会 无 限 
接近 于 一 条 光滑 的 曲线 。 这 条 曲线 精确 地 反映 了 产品 尺寸 X 在 各 个 范围 内 取 值 
的 规律 性 (如 图 2. 3. 2) 。 


频率 
ME 





图 2.3.2 
一 般 地 ,我 们 将 这 条 曲线 称 为 随机 变量 X 的 概率 密度 曲线 (curve of probabili- 
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ty density) 。 以 这 条 曲线 为 图 形 的 函数 称 为 随机 变量 X 的 概率 密度 函数 (function 
of probability density) ,简称 密度 , 记 作 r). 

以 上 的 过 程 类 似 于 微 积分 中 求 曲 边 梯 形 面积 的 过 程 。 它 的 基本 思想 都 是 先 将 
连续 问题 离散 化 ,然后 通过 无 限 细 分 取 极 限 , 将 近似 解 转 化 为 精确 解 。 

显然 ,与 离散 型 随机 变量 的 概率 分 布 类 似 ,概率 密度 函数 f(x) 必须 具备 以 下 
两 个 条 件 : 

A) f(z)>0, —oo<r<+o; 


wf fdr — 1, 
概率 密度 函数 f(z) 的 重要 作用 是 :对 任意 的 a<b, 有 
Pla<X<h)= [rea 


即 图 2. 3. 2 中 曲线 下 方 阴影 部 分 的 面积 。 

由 于 连续 型 随机 变量 取 值 的 连续 性 , 它 取 值 的 有 效 集合 必然 是 一 个 区 间 , 即 它 
在 个 别 点 上 取 值 的 概率 为 0, 因此 密度 函数 f(z) 反 映 的 是 随机 变量 X 取 x 邻 域内 
值 的 概率 的 大 小 。 用 密度 函数 来 描述 连续 型 随机 变量 与 用 分 布 列 来 描述 离散 型 随 
机 变量 是 颇 为 相似 的 。 这 样 ,概率 密度 函数 /(zx) 就 成 为 了 解 连续 型 随机 变量 的 
“窗口 "和 有 力 的 工具 。 我 们 一 旦 有 了 f(x) ,就 可 以 全 面 地 掌握 其 相应 的 随机 试 
验 。 

下 面 我 们 介绍 三 种 常见 的 连续 型 随机 变量 的 密度 。 








1. 均匀 分 布 
定义 2.3.1 如果 随机 变量 X 的 概率 密度 函数 为 
二 gago 
ro = fie TR 
0, 其 它 


则 称 X BRA EECa, b] E 8935 5) A (evenly distribution) , 记 作 U[a, b], HR 
密度 曲线 /(z) 如 图 2.3.3 所 示 。 
对 于 任意 区 间 [c, d]C[La,b], 都 有 


i i 
Pexx«o-[ l a, -d—c 
epu, ha 


由 此 可 以 看 出 , 它 在 [a, 0] EIE — AT X EAA 8E, 55 F DC ISI HO HC JE 
成 正比 ,与 子 区 间 在 Le, 5] 中 的 位 置 无 关 。X 取 值 的 等 可 能 性 反映 了 一 种 “均匀 
性 ”, 可 以 说 这 是 一 种 “连续 情形 下 的 古典 概 型 ”, 在 实际 中 有 广泛 的 应 用 。 前 面谈 
到 的 乘客 在 车 站 的 “候车 时 间 X” 就 服从 均匀 分 布 。 随 机 取 一 个 实数 ,只 考虑 其 小 
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数 部 分 , 则 小 数 部 分 也 服从 [0，1] 上 的 均匀 
分 布 。 


2. 指数 分 布 


定义 2.3.2 如 果 随 机 变量 X 的 概率 
密度 函数 为 
Ae". r0 


fa) = 
0, zxz<0 

其 中 4 二 0, 则 称 X 服从 参数 为 的 指数 分 
布 (exponential distribution), 记 作 E (A). 
其 概率 密度 曲线 F(z) 如 图 2.3.4 所 示 。 

指数 分 布 常用 作 各 种 “寿命 "分布 的 近 
似 。 例 如 ,无 线 电 元 件 的 寿命 ,动物 的 寿 
命 ,电话 的 通话 时 间 等 都 近似 服从 指数 分 
布 。 指 数 分 布 具有 无 记忆 性 , 它 的 直观 意 
义 是 有 些 元 件 在 使 用 过 程 中 损坏 与 否 同 过 
去 使 用 的 历史 无 关 。 


3. 正 态 分 布 


f(z) 





图 2.3.3 





定义 2.3.3 ”如果 随机 变量 X. 的 概率 密度 函数 为 


Varo 

Kp o0, WEK X RASNA u, o^ 的 正 
态 分 布 (normal distribution )。 简 记 为 
Niu, ò), 其 概率 密度 曲线 f(x) 如 图 2. 3. 
5 所 示 。 

特别 当 p 二 0, o—1 时 , 称 随机 变量 X 
服从 标准 正 态 分 布 (standard normal distri- 
bution) , 记 为 N(0, 1)。 此 时 X 的 概率 密 
度 函 数 记 为 pCz), 即 


f(z) = 








eG) = e 三 ,一 co << 工 < 十 co 


V 2x 


f(z) 


图 2.3.4 


e, — o< ar <H o 
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密度 函数 曲线 g(x) 如 图 2. 3.6 所 示 。 








e) 
由 微 积分 中 的 作 图 法 及 f(x) 的 图 形 ， i 
可 得 出 曲线 f(z) 具 有 以 下 性 质 : J 
(1) 以 直线 r= py 为 对 称 轴 ; 
(2) 以 直线 > 一 0(z 轴 ) 为 渐 近 线 ; 
(3) 当 z=py 时 ,f(z) 有 极 大 值 L - 
Ta o E 
co [^ fdr = 1, 即 曲 线 与 z 轴 图 2.3.6 


之 间 的 面积 为 1。 

以 上 4 条 性 质 中 , 当 y=0, 0=1 时 即 为 PCz) 的 性 质 。 

正 态 分 布 在 实践 中 和 理论 上 都 非常 重要 。 测 量 误差 和 很 多 产品 的 物理 指标 
(产品 的 长 度 、 宽 度 、 质 量 指标 等 等 ) 都 可 以 看 作 服 从 正 态 分布 。 在 前 面 引进 概率 密 
度 函数 概念 时 遇 到 的 产品 尺寸 就 服从 正 态 分 布 。 另 外 其 它 许多 分 布 在 一 定 条 件 下 
都 可 看 成 正 态 分 布 。 


B, 一 维 正 态 曲 线 演示 实验 


例 2.3.1 设 连续 型 随机 变量 X 的 密度 函数 为 
人 tere? 
其 它 
H PA<X<3)=0. 25 RE C a 和 5b; 并 计算 P(X 二 1. 5)。 
解 ”由 密度 函数 的 性 质 | adr = | (oz + bde = 2 十 2 一 1 及 


fa)- 


PA<X<3) = fira = fm +b)dr = 1.5a +b = 0.25, 可 得 方程 组 
] 1 


2a+2b=1 
1. 5a +b = 0.25 
解 此 方程 组 得 a= —0.5, b=1, FE 


P(X>1.5)= f foa 





= f _ (一 0.5z 十 1)dz = 0.0625 
例 2.3.2 设 连续 型 随机 变量 X 的 密度 函数 为 
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» z€[0,1] 


， r€[3,6] 


1 
3 
Cr) 一 12 
9 
0， 其 它 


| 
di PCX>> 包 一 地, 求 数值 人 的 取 值 范围 。 


解 ” 因 为 P(X 之 及 一 | fedr, A 
dk 0.9 





" $ s 
PG = f'ode Là [f 2dr=l1+2=1>2 
i 23 29 3 t3 
d oz 
Pi [à MERE TR 
Pxl20-[fiaecx[ia-la priLi, 





El«k«cidl 
3 * 2 2 
Pac o = [oae f Dae, 
Á 19 3 
若 3 一 4 一 6, 则 
| 2fg- 2. 
PX >w =| 2a 3(6 一 人 ) 过 也 
车 k 宇 6, 则 
P(x>6=| odz = 0; 
à 


故 应 取 1 和 4 和 3。 
此 题 由 f(x) 的 几何 意义 很 容易 求 得 (如 图 2. 3.7) 。 


f(x) 
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因为 S — D. xs Diti PCX> 包 表示 的 正 是 在 点 z 一 k 右 侧 的 面积 值 ,所 以 


只 有 1<A<3 时 , 才 可 使 POCHO — 3. 


练习 2.3 


1. 设 连续 型 随机 变量 X 的 概率 密度 曲线 如 图 2. 3. 8 所 示 , 试 求 
fle) 





M 2.3.8 


Die 的 值 ; (DX 的 概率 密度 f(z); (3)P( 一 2 二 X<2)。 
2. 设 连续 型 随机 变量 X 的 概率 密度 为 


psia Oxcr-a 


(r) = 
fe 其 它 


试 确定 常数 a, HR POCO. 


3. 函数 e”*" 乘 以 什么 常数 可 使 其 变 成 概率 密度 ? 
4. 随机 变量 X — N Gao) ,其 概率 密度 函数 为 


fame P Lore bon 
T 


vön 
试 求 wo ; 若 已 知 [reas - [ fdr ok C. 
5. 设 连 续 型 随机 变量 X 的 概率 密度 为 
" pe 0c zr«l 
: KU 
以 Y 表示 对 XX 的 三 次 独立 重复 试验 中 *X< 二 "出现 的 次 数 , 试 求 概率 P(-2. 
6. 设 随 机 变量 X 服从 [0, 5] 上 的 均匀 分 布 , 试 求 P(x 二 Xx;) ,如果 
(D a oe (Dns 
7. 设 顾客 排队 等 待 服务 的 时 间 X( 以 分 计 ) 服 从 4 一 二 的 指数 分 布 。 某 顾客 等 
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待 服务 , 若 超过 10 分 钟 ,他 就 离开 。 他 一 个 月 要 去 等 待 服务 5 次 ,以 Y 表示 一 个 月 
内 他 未 等 到 服务 而 离开 的 次 数 , 试 求 Y 的 概率 分 布 和 PYS). 


2.4 分 布 函数 


1. 分 布 函 数 


离散 型 随机 变量 可 以 由 概率 分 布 来 描述 ,连续 型 随机 变量 可 以 由 密度 函数 来 
描述 。 其 它 类 型 的 随机 变量 如 何 来 描述 呢 ? 分 布 函数 就 是 一 种 描述 包括 离散 型 和 
连续 型 随机 变量 在 内 的 一 切 类 型 随机 变量 的 非常 有 效 的 工具 。 

定义 2.4.1 设 X 是 一 个 随机 变量 ,对 于 任意 实数 zx, 函数 

F(z) 一 P(X 和 rz)， 一 cc<z<< 十 co 
称 为 随机 变量 X 的 分 布 函数 (distribution function) 。 

对 于 任意 给 定 的 x,(X<z) 是 一 个 随机 事件 ,而 F(x) 就 是 这 一 事件 发 生 的 概 

率 。 因 此 对 任意 的 a<b, 有 
P(a X&b) 7 POXEb) — POX a) — FO) — FCa) 

从 这 个 意义 上 讲 , 分 布 函数 F(z) 完 整地 描述 了 随机 变量 (无 论 是 离散 的 还 是 
连续 的 ) 的 统计 规律 。 

分 布 函 数 F(z) 具 有 以 下 性 质 : 

(1) F(z) 是 单调 不 减 的 , 即 对 于 任意 rı <r H FaFa); 

(2) 0C FG «1l, 

(3) lim F(z) —0, lim FG) —1, igf£ 下 一) 一 0，F( 十 oo) 一 1; 

(4) F(z) 在 每 点 x 处 均 是 右 连续 的 , 即 lim FCz 十 se) 一 FCz), 记 作 FCz 十 0) 一 


FG), 

对 于 离散 型 随机 变量 X ,相应 的 分 布 函数 性 质 如 下 。 

COD FEA X 的 概率 分 布 为 PLX 二 zz ) 三 pi,k 二 1,，2,… ,那么 随机 变量 的 
分 布 函 数 F(z)= 3] p. ;反之 , 若 已 知 X 的 分 布 函数 为 下 (z), 则 随机 变量 X 的 概 


率 分 布 为 p, POX— 2) — FG) — FGr, 70), &—1. 2, 7, 
所 以 概率 分 布 和 分 布 函数 是 一 一 对 应 的 。 
(2) 对 任意 的 a<b, 有 
P(X<a)=F(a—0), P(Xza) —1—F(a—0), 
P(as X5) - FQ) — F(a) 
P(as X«b) — F(5—0) —F(a—0); P(ac X«b) — F(b—0) — F(a), 
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对 于 连续 型 随机 变量 X, 相 应 的 分 布 函数 性 质 表现 如 下 。 
(1) 若 已 知 的 概率 密度 函数 为 (zx), 那么 随机 变量 X 的 分 布 函数 


FG) =f f(Ddt, — oo < x <+ 0 


反之 , 若 已 知 X 的 分 布 函数 为 下 (z) ,在 密度 函数 连续 的 点 r 处 ,有 F (x)= 
f GO FG x Beg iR. 

所 以 概率 密度 函数 和 分 布 函数 是 一 一 对 应 的 。 

(2) 对 任意 的 a<b, 有 
P(X<a)=P(X<a)=F(a); 
P(X>a)=P(X>a)=1—F(a) 
Pla<X<bh)=P(a<X<b)=P(a< Xb) 

=P(a<X<b)=F(b)— F(a); 
例 2.4.1 设 X 的 概率 分 布 为 : 











求 @ 分 布 函 数 F(z) 在 z=1.5 处 的 值 ; @X 的 分 布 函数 并 作 图 ; @P(CX>0) 
和 PO. 5-—X-—5), 


f O F.5)—P(OXCIL 5) - POX— —1)8- PCX —0) —0, 32-0. 5—0. 8 
Q A z€(C—-oo, — DRE. FG)—0; 

X r€[—1, 0) 时 , F(z)=P(X= 一 1)=0.3; 

当 zE[0, 2) 时 ,F(z)=P(X= 一 1) 二 P(X 一 0)=0.8; 

M r€[2, 十 oo0] 时 ,F(z)=P(X= 一 1) 十 P(X=0) 二 P(X=2)=1。 
综 上 所 知 ,X 的 分 布 函 数 F(z) 为 


0, Fei 
0.3, —1« z«0 
FG) = iio 
08. 0Ocz«2 
1, r22 


F(z) 的 图 形 如 图 2. 4. 1 所 示 。 

由 F(x) 的 图 形 , 可 以 很 直观 地 显示 出 
F(x) 的 4 条 基本 性 质 。 

图 P(X>0)=1—F(0)=1—0.8= 
0.2, 当 然 也 可 以 这 样 计算 P(X 二 0)= 
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P(X—2)—0.2, 

P(0, 5«X«5) — FC5—0) — FC0. 5) —1—0. 3—0. 7, 4 fA n] Dx RE HA 
P(0, 5 X«5) 2-POX —0)--PCX —2) —0. 7. 

反 过 来 , 若 已 知 X B9 4r dn BS CF Cao f epo X 的 概率 分 布 (请 读者 自己 计 
算 )。 


BL 离散 型 随机 变量 常见 分 布 演示 实验 


例 2.4.2 设 随机 变量 XX 服从 [a, 5] 上 的 均匀 分 布 , 求 DX 的 分 布 函数 F(z) 
并 作 图 ; OË rı <a<r: <b, R PX). 

解 ” 因 为 X 的 密度 函数 为 

d arb 
f) — 4b—a 
0, 其 它 

当 ze (— œ, a) 时 ,F(x) = f fdr = 上 (dr — 0; 
M x € [as b) Bl, F(x) =f rod =f T 一 工 二 < 


b—a! 





M x € [b. 十 cc] 时 ,F(z) = 上 fdt = [ Las 


5— 
综 上 所 知 ,X 的 分 布 函数 F GODS 
0， r«a 
F(z) = Es 

F(z) 的 图 形 如 图 2. 4.2 Bros. 

由 F(x) 的 图 形 , 可 以 验证 F(z) 的 4 条 基 
本 性 质 。 

Q Pi «X«n)—-FGüD0—FGG)- 
X:—a Q. Ta 
b—a ^ Poa’ 


Bb 连续 型 随机 变量 常见 分 布 演示 实验 





例 2.4.3 已 知 连续 型 随机 变量 X 的 分 布 函数 为 
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FG) —A-F Barctanr, —oee«r« doo 
WRO A RI B; @ 概 率 密度 函数 SO). 


解 ”@ 因 为 F( 一 ~“)=A 一 B， $79 FCEoS)— AB * $0 RHIART 
d acl gat 
RA—-.,.B x* 


Q fGa)—F'G)-— 


Rt" exem 


2. ERD Ahy A ER TC 


在 日 常生 活 中 ,无 论 是 实际 计算 还 是 理论 分 析 , 正 态 分 布 起 着 重要 的 作用 ,为 
此 作为 讨论 分 布 函 数 的 例子 ,我 们 对 正 态 分 布 的 分 布 函数 作 进 一 步 的 研究 。 
db X 一 NG o) ,其 概率 密度 函数 为 fCz), 则 X 的 分 布 函数 为 


FG)- f fdt 





VM dr, — o < z <+ o0 








Fud 
a Vane 
di X 一 N(0，1)。 则 标准 正 态 分 布 的 分 布 函数 为 
@(z) 一 f plDdt 


et < 十 co 
-[ JA dt, pE t 
那么 FCz) 和 @(z) 之 间 有 什么 关系 呢 ? 
因为 F(x) = | 于 di, 由 定 积分 的 换 元 法 , 令 y = EFR di = 


2ro 





o * dy, A i 





Fo) - [7 "s = e(4—4) 


所 以 便 得 到 如 下 结论 : 若 Xo NO 60 JU XHESEII a<b. 4 
Pla < X <b)= FO) — Fla) 


«aea on 


由 更 (z) 的 对 称 性 知 :8( 十 ce) 一 0，@(0) 一 上 二，@( 一 z) 一 1 一 @(z)。 


例 2.4.4 已 知 连续 型 随机 变量 X~N(10, 2) , 求 P(10 二 X=<13), P(X 宇 13)， 
P(|X—10|<2). 
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1719) 9 (1910 


& PQ0<X<13)=g( )=00.5)=00) 


z 2 
—0. 9332—0. 5—0. 4332; 
POGei3 21—9(53719) —1—0. 9332-0. 0668; 


2 2 
—24(1) —1—2*X0. 8413—1-—0. 6826 
例 2.4.5 设 连 续 型 随机 变量 X— NC. 60. HEA POX« —1.6)—0.036, 
P(X>5.9)==0.242, 求 u,o, P(X>>0)。 


解 因 PO -1. 6) -e( =E) =0. 036, ico (1552) -1—o. 036— 


P(X-101«-Pa«Xx«12-e(2719) (871?) 


0.964, 
X PCS. 9) -1- P(X<5. 9) -1- e (32) - o. 242, BEA o(9-2)- 
0. 758, 查 表 可 得 
l6t*5.]g 
o m|” =3.8 
5.9—59 0,7 o 
s 


P(X>0)= 1-e($—$5)- 1—6&(— 1.27) = @(1.27) = 0.898 


3. 连续 型 随机 变量 函数 的 分 布 


下 面 通过 一 个 例子 来 说 明 怎样 求 连续 型 随机 变量 函数 的 概率 密度 函数 。 

例 2.4.6 设 随机 变量 X~N Cp, or), 求 Y 二 kX 十 b 的 概率 密度 函数 ,其 中 上 ， 
b HERRE. 

解 ”此 类 型 题目 一 般 先 求 出 的 分 布 函数 ,然后 通过 求 导数 Fy(>), 求 出 密 
度 函 数 fy(y)。 

设 4A>0,Y 的 分 布 函 数 为 Fy(y), 则 


FyG)— P(Y < y) = PGX +b < y) = P(z <27) 














k 


e [cons 
Bk Y —&X--b 的 概率 密度 函数 为 
fi) Fro = f(t) 
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y— GT AY 











EM! L ; 
| 20)* | Werth 
同 理 可 得 , k<0 时 ， 
z 1 [D O+] 
Fro) AE z| 20o? | 
综 上 所 知 ,， 当 & 尖 0 时 ,有 
" 1 JD» — G - o 
fidt =] e 


这 表明 Y —EX--b— NG-- kp, k'o Qc 0) ,也 就 是 说 ,服从 正 态 分 布 的 随机 
变量 的 线性 函数 仍 服从 正 态 分 布 。 此 方法 称 为 “分 布 函数 法 ”, 是 求 连续 型 随机 变 
量 函 数 分 布 的 一 般 化 方法 ,这 里 我 们 再 加 以 概括 总 结 如 下 : 

首先 ,根据 分 布 函数 定义 ,从 随机 变量 函数 的 分 布 函数 出 发 , 找 出 函数 和 自 变 
量 分 布 函数 之 间 的 关系 ,这 一 步 的 关键 是 解 不 等 式 ; 

其 次 , 求 导数 , 找 出 函数 和 自 变量 密度 之 间 的 关系 ,这 一 步 的 关键 是 复合 函数 
求 导数 ; 

最 后 ,将 自 变量 的 密度 具体 化 。 这 一 步 的 关键 是 知道 内 层 函 数 、 外 层 函 数 , 求 
复合 函数 ,有 时 需要 分 类 讨论 。 

下 面 不 加 证 明 地 给 出 当 ?一 5(z) 为 单调 可 导 函 数 时 的 一 般 结论 。 

设 X~fx(z),y 二 g(z) 是 单调 可 导 函 数 ,其 导数 恒 不 为 零 。 记 x 二 h(y) 是 
y—gGOfM E BE. (a, 0) 是 y= g Cx BO (f B, rh — oo a rb H co, N 
Y=&(X) 是 连续 型 随机 变量 ,其 密度 为 

fx[Lh(y)J lhy) |, a yb 
fr(y) = 0, 其 它 
显然 例 2. 4. 6 可 直接 用 此 结论 来 计算 。 


练习 2.4 
1. 已 知 随机 变量 X 的 概率 分 布 为 PCX 一 1) 一 0.2，P(X 一 2) 一 0.3，P(X 一 3) 一 


0. 5, 试 求 X 的 分 布 函数 ;P(0. 5X 2) iB FC B Hl 
2. 设 连 续 型 随机 变量 X 的 分 布 函数 为 


0, — z«-1 
04, —1xz«l 
FG) 一 epe 
08. l&z«3 


l, rz 
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试 求 (1)X 的 概率 分 布 ; DPOXEC2|I XD. 

3. 从 家 到 学 校 的 途中 有 3 个 交通 岗 ,假设 在 各 个 交通 岗 遇 到 红 灯 的 概率 是 相 
互 独立 的 , 且 概率 均 是 0.4, 设 X 为 途中 遇 到 红 灯 的 次 数 , 试 求 (1)X 的 概率 分 布 ; 
(2) X 的 分 布 函数 。 

4. 试 求 习题 2. 3 中 第 1 题 X 的 分 布 函数 ,并 画 出 F(z) 的 曲线 。 

5. 设 连续 型 随机 变量 X 的 分 布 函数 为 
ATBe", r0 

0, I<0 
试 求 (1)a, b 的 值 ; (2)P( 一 1 一 X 一 1); (3) 概 率 密度 函数 r). 

6. 设 X 为 连续 型 随机 变量 ,其 分 布 函数 如 下 


FG - | 


a, r«l 
FG) —46rlnrccer-cd, l<r<e 
d. re 


试 确定 F(x) 中 的 a, b. c. d 的 值 。 
7. 设 随机 变量 X 的 概率 密度 函数 为 F(z) 二 


FDM PXI). 

8. (LEA VETE TRE A t CHE) 6 893 D [6] RR V E ^ b RE cC N CO A SC 
为 4 二 0. 14 的 Poisson 分 布 ,X 表示 连续 两 次 地 震 之 间 相 隔 的 时 间 ( 单 位 :年 )。 

CD EB] X 服从 指数 分 布 并 求 出 X 的 分 布 函数 ; 

(2) 今 后 3 年 内 再次 发 生地 震 的 概率 ; 

(3) 今 后 3 年 到 5 年 内 再 次 发 生地 震 的 概率 。 

9. 设 X—NC-1. 16), 试 计算 (1D)P(X<2.44); (2POCS —1.555 GO PCI X| 0; 
(4)P(IX 一 1| 之 1)。 

10. 某 科 统考 成 绩 X 近似 服从 正 态 分 布 N (70, 10?) ,第 100 名 的 成 绩 为 60 
分 , 问 第 20 名 的 成 绩 约 为 多 少 分 ? 

11. 设 随机 变量 X 和 YY 均 服 从 正 态 分布 ,X 一 NO, 到),Y 一 NG 5). ii 
pbi POCGZu—4 p= PY 2o 8) RENI : pi = pz o 

12. 设 随机 变量 X 服从 均匀 分 布 , 令 Y 二 cX 十 d(c 去 0) , 试 求 随机 变量 Y 的 密 
度 函 数 。 


SURE Gun ' 试 确定 a 的 值 并 求 


2.5 应 用 SPSS 计算 概率 


SPSS 是 美国 SPSS 公司 自 20 世纪 80 年 代 初 开发 的 大 型 统计 分 析 软 件 包 。 
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经 过 逐步 升级 ,其 功能 更 强大 ,应 用 更 广泛 ,界面 也 十 分 友好 ,非常 适合 作为 教学 和 
科研 的 统计 软件 。 本 书 使 用 SPSS11. 5 for Windows 版 本 进行 有 关 统 计 分 析 和 数 
据 处 理 。 


1. 正太 分布 


设 X 一 N(0,，1) , 则 P(X 入 zx) 可 以 通过 以 下 步骤 计算 。 

在 SPSS 数据 编辑 窗口 (需要 随便 打开 一 个 数据 文件 ) ,依次 点 击 Tansform 一 
Compute 得 到 一 个 对 话 框 ,在 Targat Variable 里 写 人 p, 在 右 侧 Functions: 中 选 
CDF. NORMAL (q, mean, stddev) 并 点 击 向 上 的 箭头 使 该 函数 放 人 Numeric 
Expression: 中 ,在 三 个 问号 处 填 人 (z,，0，1) ,点击 “OK” 便 得 到 概率 PXST). 
如 P(XS<1.96)= CDF.NORMAL(1. 96,0,1) —0. 975, P(X<—1.96)= CDF. 
NORMAL(-— 1. 96,0,1) —0.025 ,P(| X| &1. 96) — CDF. NORMAL(I. 96,0,1) 
— CDF. NORMAL. 1. 96,0,1) —0. 975 —0. 025—0. 950, 

对 于 一 般 正 态 分 布 N(y, 00 , 仅 需 要 将 CDF. NORMAL(q, mean, stddev) 中 
的 mean 写成 kw，stddev 写成 o 即 可 。 

注意 ,对 于 标准 正 态 分 布 也 可 用 函数 CDF. NORM (e value), All X— NC, 1), 
P(X<1.96)= CDF. NORM (1.96) —0. 975, 


2. 二 项 分 布 


设 X 一 B(n， p) W P(X<z)=CDF. BINOM (z, n, p). 如 X~B(5, 0.5), 
P(X«3) - CDF. BINOM(3,5 ,0.5) —0. 8125, 
P(X=3)=P(X<3)—P(X<2) 
—CDF. BINOM(3,5 ,0.5) — CDF. BINOM(2,5 ,0.5) 
—0. 8125— 0. 5000—0. 3125, 
或 者 P(X=3)= PDF. BINOM(3,5,0. 5) —0. 3125, 


3. MA 


dE X—PGO , 则 PCX«x) —CDF. POISSON (z, à). fll X~P(0. 9), 
P(X—2) - POX&2) - POXC1) 
= CDF. POISSON(2,0. 9) — CDF. POISSON(1,0. 9) 
70. 9371— 0. 7725 —0. 1646. 
或 者 PCX —2) —PDF. POISSON(2,0. 9) —0. 1646. 
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4. 指数 分 布 


设 X~EA), M) PCX«x) —CDF. EXP (x, 4)。 


5. 均匀 分 布 


d X—U(a, b]W) PCX«x) — CDF. UNIFORM(zx, a, b). 


B 常见 分 布 函数 值 演示 实验 


第 3 章 随机 向 量 及 其 分 布 


第 2 章 我 们 讨论 了 一 维 随机 变量 .但 是 在 实际 应 用 中 ,有 一 些 随机 现象 用 一 个 
随机 变量 是 无 法 进行 全 面 描述 的 。 例 如 为 了 评估 某 种 电视 机 的 质量 ,不 仅 要 看 “ 电 
视 机 在 一 年 中 发 生 的 故障 数 ”, 而 且 还 要 同时 考虑 “一 年 中 电视 机 使 用 的 小 时 数 ”、 
“电视 机 画面 的 清晰 度 " 等 指标 ;冶炼 钢水 时 ,要 同时 考察 其 含 碳 量 、 含 硫 量 以 及 某 
种 稀有 人 金属 的 含量 等 多 个 指标 ;在 研究 儿童 的 身体 发 育 状况 时 ,要 同时 分 析 身 高 、 
体重 ,视力 等 多 个 方面 的 因素 ;在 研究 国民 经 济 发 展 的 运行 状况 时 ,要 经 常 分 析 居 
民 的 储蓄 存款 余额 、 国 民 收入 及 通货 膨胀 等 多 个 经 济 指标 。 因 此 ,同时 研究 多 个 随 
机 变量 的 概率 分 布 规律 是 十 分 必要 的 。 它 不 仅 可 以 使 我 们 更 全 面 、 更 准确 地 掌握 
所 研究 的 随机 现象 ,而 且 还 可 以 对 其 中 每 一 个 随机 变量 的 概率 特征 及 这 些 变量 问 
的 联系 有 更 清晰 的 认识 。 为 此 ,我 们 需 将 这 多 个 随机 变量 作为 一 个 整体 ,看 作 一 个 
随机 向 量 (random vector) 来 分 析 , 并 研究 其 概率 分 布 规律 及 这 些 变 量 间 的 相互 依 


3.1 随机 向 量 及 其 分 布 
1. 随机 向 量 


定义 3.1.1 nPI X, Xos ee X, 为 分 量 的 n 维 向 量 (XI，X， 
“，X,) 称 为 n 维 随机 向 量 。 
以 下 主要 研究 二 维 随机 向 量 的 情形 。 


2， 一 维 离散 型 随机 向 量 及 其 联合 概率 分 布 .边缘 概率 分 布 


定义 3.1.2 如 果 二 维 随机 向 量 (X,Y) 所 有 可 能 取 值 至 多 为 可 数 个 , 则 称 
(X,Y) 为 二 维 离散 型 随机 向 量 (discerete random vector) . 

显然 ,如 果 (X, Y) 为 二 维 离散 型 随机 向 量 , 它 的 分 量 X 和 YY 都 是 离散 型 随机 
变量 ,反之 亦 然 。 与 离散 型 随机 变量 相似 ,通常 我 们 用 一 系列 等 式 来 描述 离散 型 随 
机 向 量 的 概率 分 布 。 
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设 (X, Y) 的 所 有 可 能 取 值 为 (x;， yj) 记 
PIX = Y=%)= ü-—1,2.—,j—1.2,-2 IL 
称 式 (3. 1. 1) 为 离散 型 随机 向 量 (X, Y) 的 联合 概率 分 布 (joint probability distribu- 
tion) 。 


显然 , 式 (3. 1. 1) 中 的 ps 具有 如 下 性 质 : 


(1) p; >0; 
G9 p= Ti 
GQ)PX,YD€D- M ps 


Gr yp ED 


为 直观 起 见 , 有 时 用 概率 分 布 表 ( 见 表 3. 1. 1) 来 表示 二 维 离散 型 随机 向 量 
(X,Y) 的 联合 概率 分 布 。 


表 3.1.1 











在 随机 向 量 (X, Y) 中 ,随机 变量 X 的 分 布 称 为 (X, Y) 关 于 X 的 边缘 概率 分 
布 (marginal probability distrbution) ,随机 变量 Y 的 分 布 称 为 (X, YO XT Y 的 边 
缘 概率 分 布 。 

对 于 二 维 离散 型 随机 向 量 (X, YO ,如 果 已 知 (X, Y) 的 联合 概率 分 布 ,容易 求 
得 相应 的 边缘 概率 分 布 。 设 (X,Y) 的 联合 概率 为 


P(X=zi, Y=%)=ps, (i=1, 2, =, j=1, 2, =) 
则 (X, VAF X 和 YY 的 边缘 概率 分 布 分 别 为 
pi = P(X—z)-Mbp,i-21,2,- 


py = PY =y) = Dpi j=l, 2, + 
例 3.1.1 有 一 批 产品 共 12 件 , 其 中 9 件 一 等 品 ,3 件 二 等 品 , 现 从 中 连续 不 
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放 回 地 抽取 两 次 ,每 次 1 件 。 记 X 为 第 一 次 取 到 的 一 等 品 数 ,Y 为 第 二 次 取 到 的 
一 等 品 数 。 求 

O OX. Y) 的 联合 概率 分 布 ;@ (X, VAF X. Y 的 边缘 概率 分 布 。 

解 ” 依 题 知 (X, Y) 所 有 可 能 的 取 值 为 (0, 0), (0, 1), (1, 0), (1, 1)。 因 为 














P(X=0,Y=0)= P(X=0). P(Y=0|X=0) 
= 
n X 12 11 22' 
P(X=0,Y=1)= P(X=0). P(Y =1|X=0) 
z 23. 
44" 
P(X=1,Y=0)= P(X=1). P(Y=0|X=1) 
-Q.Q sy3.5 
Ch Ch I 11 44 
P(X=1,Y=1)= P(X=1). P(Y=1|X=1) 
-Q.Q 9,8 6 





由 上 表 可 得 
z- es = - m1) d ed. 
PX =0) = PX =0, Y=0+PX=0,Y=D= 5+8; 
PX-D-PX-1,Y-04PX-1,Y-D-24$.3, 
acti T 


FEX, Y) 关 于 X 的 边缘 概率 分 布 为 
x | œ 1 
| 1 3 





P 
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同样 可 得 (X,Y) 关 于 Y 的 边缘 概率 分 布 为 





注意 在 本 例 中 如 果 将 “连续 不 放 回 地 抽取 两 次 " 改 为 “连续 有 放 回 地 抽取 两 
次 ”, 其 结果 如 何 ? 读者 自己 解答 。 

由 以 上 讨论 及 本 例 都 可 发 现 ,如 果 已 知 随 机 向 量 (X,，Y) 的 联合 概率 分 布 ,这 
时 关于 X 和 YY 的 边缘 概率 分 布 可 由 联合 概率 分 布 求 出 。 很 容易 理解 ,总 体 的 规律 
性 ( 即 联合 概率 分 布 ) 确 定 了 ,那么 它 的 每 个 分 量 的 规律 性 也 就 确定 了 。 善 于 思考 
的 读者 可 能 会 提出 这 样 一 个 问题 :如 果 反 过 来 已 知 关于 X 和 YY 的 边缘 概率 分 布 ， 
能 否决 定 二 维 随机 向 量 (X, Y) 的 联合 概率 分 布 呢 ? 请 看 下 面 的 例子 。 

例 3.1.2 下 面 是 二 维 随机 向 量 (X,Y) 的 联合 概率 分 布 





R OHM aX, Y) 关 于 X Y 的 边缘 概率 分 布 。 

解 ”@ 由 离散 型 随机 向 量 (X, Y) 联 合 概率 分 布 的 性 质 知 
lid onE4 
CRM US ed. 

Muasi. 

@ 根据 上 面 联合 概率 分 布 很 容易 求 得 关于 X,Y 的 边缘 概率 分 布 分 别 为 





p JA ,总 ah, 总 
e |44 e J44 


比较 例 3. 1. 1 和 例 3. 1. 2 发 现 ,两 者 具有 完全 相同 的 边缘 概率 分 布 , 但 是 它们 
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的 联合 概率 分 布 却 是 不 同 的。 由 此 可 知 ,边缘 概率 分 布 并 不 能 唯一 地 确定 联合 概 
率 分 布 。 事实 上 ,二 维 离散 型 随机 向 量 (X. Y) 的 联合 概率 分 布 不 仅 包含 了 边缘 概 
率 分 布 的 内 容 , 而 且 还 包含 X 与 Y 之 间 相 互 关 系 的 内 容 。 在 本 章 第 3.2 节 及 第 4 
章 我 们 将 进一步 讨论 二 维 离散 型 随机 向 量 (X, YOP X 与 了 之 间 的 关系 :独立 性 
和 不 相关 性 。 

例 3.1.3 电子 显示 牌 上 有 两 排 灯泡 ,第 一 排 有 2 个 ,第 二 排 3 个 , 令 X.Y 分 
别 表示 在 规定 时 间 内 第 一 排 和 第 二 排 烧 坏 的 灯泡 数 , 根 据 以 往 的 经 验 知 (X,Y) 的 
联合 概率 分 布 如 下 表 





0 1 2 3 
X 
#- A -9.02 0.06 0.08 | 0.11 
1 0. 03 0.05 0.07 0.10 
| 
2 0.04 0.06 | 0.16 0.22 





求 “@ 第 一 排 烧 坏 的 灯泡 数 不 超 过 1 个 的 概率 ; 
@ 第 一 排 与 第 二 排 烧 坏 的 灯泡 数 相 等 的 概率 ; 
图 第 一 排 烧 坏 的 灯泡 数 不 超 过 第 二 排 烧 坏 的 灯泡 数 的 概率 。 
解 ”由 联合 概率 分 布 得 
(D. 所 求 事件 的 概率 为 


PX<D= DP(X=0,Y=)+ DPX=1,Y=)) 


= 0.02 +0. 06 + 0. 08 +0. 11 +0. 03 +0. 05 +0. 07 +0. 10 
= 0.52 
@ 所 求 事件 的 概率 为 


P(X =Y)= 3JPOCX- i, Y = i) = 0.02+0.05+0.16 = 0.23 


鲜 所 求 事件 的 概率 为 
PIX<Y=1—P(X>Y) 
=I—PFX=1,Y=0—PX=2,Y=0—FBX=2,Y=1) 
一 1 一 0.03 一 0.04 一 0.06 — 0.87 
由 例 3. 1. 3 可 知 , 求 与 离散 型 随机 向 量 (X, Y) 有 关 的 某 随机 事件 的 概率 ,就 
是 根据 (X, Y) 的 联合 概率 分 布 , 将 此 事件 中 所 包含 的 (X, Y) 取 所 有 可 能 值 的 概率 
相 加 即 可 。 
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3. 二 维 连 续 型 随机 向 量 及 其 联合 概率 密度 .边缘 概率 密度 


定义 3.1.3 对 二 维 随机 向 量 ( 炙 , YO ,如 果 存 在 非 负 函 数 ,使 得 对 平面 上 任意 
EEK  D— (OX. Y)la<X<b, <Y<d} BA 


PX. Y) € D) = re y drdy 
5 


则 称 (X, Y) 为 二 维 连续 型 随机 向 量 ( continuous random vector ) , f 3E ff PR "C 
f(z，y) 为 随机 变量 X 与 Y 的 联合 概率 密度 (joint probability density), 记 为 
(X,Y)~f(zr, y), 

由 定义 知 ,作为 X 和 Y 的 联合 概率 密度 f(x,y) 具有 如 下 性 质 : 

(OD flr, y) 20; 


of | " Fii ydsdy T; 


(3)P{CX, Y) € D) = [re y)dzdy。 


b 
如 果 (X, Y) 是 二 维 连续 型 随机 向 量 , 它 的 两 个 分 量 X 和 YY 也 分 别 是 连续 型 
随机 变量 , 则 称 X 的 概率 密度 函数 fx(z) 为 (X，Y) 关 于 X 的 边缘 概率 密度 (mar- 
ginal probability density) ;同样 称 Y 的 概率 密度 fy(y) 为 (X,Y) 关 于 Y 的 边缘 概 
率 密度 。 
BOX Y) f. y) WA 


fé = filz) = f fiz, y)dy 


fy(y) = 户 (y) E[ flx, ydr 


注意 与 二 维 离散 型 随机 向 量 不 同 , 二 维 连 续 型 随机 向 量 不 能 简单 地 定义 为 : 
“各 分 量 都 是 一 维 连 续 型 随机 变量 的 随机 向 量 "。 例 如 : 设 随机 变量 X 服从 区 间 
[0,，1] 上 的 均匀 分 布 ,Y 一 X, 显 然 随 机 向 量 (X,Y) 的 两 y 
个 分 量 X 和 Y 都 是 连续 型 的 。 但 是 由 于 (X, Y) 的 取 值 
只 能 在 图 3. 1. 1 所 示 的 正方 形 的 对 角 线 上 ,因而 对 任何 
非 负 函数 f(x,y) ,在 R^ 上 的 积分 等 于 其 在 对 角 线 上 的 
积分 , 恒 等 于 0, 即 随机 向 量 (X, Y) 的 联合 分 布 密 度 不 
存在 ,不 是 连续 型 随机 向 量 。 

下 面 介绍 两 种 常见 的 二 维 连续 型 随机 向 量 。 
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(1) 二 维 均匀 分 布 
若 二 维 随机 向 量 (X, Y) 的 联合 概率 密度 为 


-地 Ge »€D 
0, 其 它 
其 中 D 为 平面 上 的 一 个 可 度量 的 有 界 区 域 , Se 是 区 域 D 的 面积 , 则 称 (X,Y) 服 
从 区 域 D 上 的 均匀 分 布 。 
对 于 DD 中 的 任意 可 度量 子 区 域 G, 有 
P(G. y € G) = [re dy = E: 


其 中 S; 为 G 的 面积 。 上 式 表明 :二 维 随机 向 量 (X， Y ABURG 的 概率 与 G 的 
面积 成 正比 ,而 与 G 在 D 中 的 位 置 和 形状 无 关 。 由 此 可 知 , “均匀” 分 布 的 含意 就 
是 “等 可 能 ”的 意思 。 

例 3.1.4 设 二 维 随机 向 量 (X,Y) 在 区 域 D={(z, y)10<z<1, |y|<z} 
内 服从 均匀 分 布 , 求 @ (X,Y) 的 联合 概率 密度 ; © (X,Y) 的 边缘 概率 密度 ; 


Q Pc. 


SR CD 区 域 D 如 图 3.1.2 所 示 阴影 部 分 ,其 面 
积 为 


S,-ixix2-1 
所 以 (X, Y) 的 联合 概率 密度 为 


1, Lell lyl<zx 
，y) 一 
dpi M 其 它 
Q 当 0<z<1 时 ,有 
fie = [fis ydy o f dy = 2e 
所 以 (X,Y) 关 于 XX 的 边缘 概率 密度 为 
22, 0<z<1 
iG = 
JP [P 其 它 
同 理 , 当 一 1 二 y<0 时 ,有 
fi) - [fe d= f dr=1+y 
当 0<y<1 时 ,有 
ge 
f) — | fa, war = f'dar =1-y 





图 3.1.2 
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所 以 (X, YOXCT Y 的 边缘 概率 密度 为 
fl». —1«y«0 
的 0cy«cl 
0, 其 它 


图 所 求 随机 事件 的 概率 即 等 于 (X, Y) 落 入 区 域 C 一 (CX, y) occi 


1 二 如 的 概率 ,而 G 的 面积 Se 一 去 去 X1 一 十, 由 均匀 分 布 的 性 质 知 


当然 ,利用 Ai GO 也 可 求 得 PLX 30 = f’ zdz — 0.25, 
本 例 也 说 明 一 个 二 维 均匀 分 布 的 边缘 概率 分 布 未 必 是 均匀 分 布 。 








Eee 
` 维 随机 向 量 (X，Y) 的 联合 概率 密度 为 
E. rus m 1 1 (ropa g Gg) (yp) 
Pars RE zi-z s 多 ao: UU ) 


其 中 一 ce<piy pH, 00. i>, [p] 1 WRX, 服从 参数 为 jn e jp， 
ei. p 的 二 维 正 态 分 布 , 记 作 C(X. Y) NGas pi oii oi, p). 
- 维 正 态 分 布 是 最 重要 的 一 种 连续 型 随机 向 量 的 分 布 ,其 联合 概率 密度 的 图 
形 好 像 一 个 椭 球 切面 的 钟 , 倒 扣 在 rOy 平面 上 ,中 心 在 (pa, yw) 点 。 
下 图 3. 1. 3 是 利用 Mathematica 软件 包 画 出 的 二 维 正 态 分 布 N(0, 0. 1, 1, 0) 
的 图 像 。 





图 3.1.3 


B, = 维 正 态 曲 面 演示 实验 
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显然 f(t,y) 宇 0, 利 用 二 重 积 分 的 变量 代 换 , 读 者 可 自己 验证 
Js fG. y) drdy — 1 


例 3.1.5 二 维 随机 向 量 (X, YO NGa « pes oi op), 求 (X,Y) 的 边缘 概 
率 密度 。 
解 ”由 边缘 概率 密度 的 定义 知 




















1 1 (一 各) 
5c =| expl- - mi 
| 2rolos Vl—p © 2a yal gi 
o - — 
255 pr — pe) | Or— p) ) lay 
9:0: oz ! 
IL f 1 一 xp 全- 1 S (EP oath te) ae 
2xo V1 — 20—90*5 a ^ 
i 1 1 z— pa 2 /TN 
一 exp | 一 cx (2— 一 人 一 dt 
Br Vip | zi-55 Pa ) e ? ))) 
_ 1 [p (zm) | 1 Tp A 42 — jn | 
aa Bo J 2x ace zl Pa ) ja 


上 式 等 号 右边 积 分 号 下 关于 4 I ERROR ES A NCTA, 1 ono 
a 


密度 函数 , 故 其 积分 值 等 于 1, 因此 (X,Y) 关 于 X 的 边缘 概率 密度 为 
a 











(x) = e 
á V/2x0i 
同样 可 得 (X.Y) 关于 YY 的 边缘 概率 密度 为 
Le 
gigi A 


Jit (P EUR RA — A IE S 43 NC» ps oi e oi p) 的 随机 向 量 (X,Y) 的 边缘 
概率 分 布 是 一 维 正 态 分 布 , 且 关于 X 0030 BORA EI NGa «6D T Y 的 边缘 
概率 分 布 为 NGc , 叶 )。 由 此 可 知 随机 向 量 的 联合 概率 密度 完全 决定 了 它 的 边缘 
概率 密度 ,但 是 反 过 来 不 一 定 成 立 。 即 边缘 概率 分 布 不 足以 决定 随机 向 量 的 联合 
概率 分 布 。 例 如 下 面 两 个 二 维 正 态 分 布 

N(0. 0. 1. 1. D 和 NC. 0. 1. 1, -p 


它们 的 任 一 边缘 概率 分 布 都 是 标准 正 态 分 布 N(0, 1) ,但 它们 却 是 不 同 的 二 维 正 
态 分 布 ,因为 p 的 值 不 同 。 对 于 这 种 现象 ,可 以 这 样 解释 :边缘 概率 分 布 只 考虑 了 
单个 随机 变量 的 分 布 情况 ,未 涉及 它们 之 间 的 关系 .而 这 个 信息 包含 在 联合 概率 分 
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布 之 内 。 就 本 例 来 说 ,在 第 4 章 第 4. 3 节 将 证 明 :p 参数 恰好 反映 了 两 个 分 量 X 与 
Y 之 间 的 某 种 关系 。 
例 3.1.6 设 二 维 随机 向 量 (X, Y) 的 联合 概率 密度 为 


Jis) 5) 6s Ee d tay), -olr yo 
RX, Y) 关 于 XY 的 边缘 概率 密度 。 
in "e 
解 fo =f flz, wdy 一 去 | e^ a+ ry)dy 


同 理 可 求 得 





在 这 个 例子 中 ,随机 变量 X 与 了 均 服从 标准 正 态 分 布 N(0, 1), 但 是 (X,Y) 
却 不 服从 二 维 正 态 分 布 , 由 此 说 明 :边缘 概率 分 布 为 正 态 分 布 的 二 维 随机 向 量 不 一 
定 是 二 维 正 态 分 布 。 
例 3.1.7 设 二 维 随机 向 量 (X, Y) 的 联合 概率 密度 为 
-er zr>0,y>0 
0， 其 它 
试 求 :DO PO<X<1, 0<Y<1); OX, Y) 关 于 X.Y 的 边缘 概率 密度 。 
解 DPO<X<1,0<Y<1)= [dzdy Š jeu : f eav 


fas y= 人 


= (1—e') 
© 当 z>0 时 ,有 
fx(z) = emay = e [ea =e"; 
当 xz 和 0 时 ,有 fx(r)=0. 
所 以 (X, Y) 关 于 X 的 边缘 概率 密度 为 
e*, r0 


t= 
Jetz H z<0 


第 3 章 随机 向 量 及 其 分 布 51 





同样 可 求 得 (X, VAF Y 的 边缘 概率 密度 为 
ec Ie y»0 
fy(y) = 0. y«o 
例 3.1.8 设 二 维 随机 向 量 (X, Y) 的 联合 概率 密度 为 
2 Pe Vr Fy), r+y >R 
fürs 
0, 其 它 
值 的 概率 。 
解 D1= LE ` fæ, Wdrdy = [ CR 一 Vx yo dzrdy 
Jy egt 


x R 
=f [Lec — podpao 
= IR? 
一 于 CR 
4c--3. 
BIB C=. 
© 当 R=2 时 ,有 
pPo-Y«p- [ ÈR- VY) 
T 


3p p 
= &f af  — pd 
1 


2 
例 3.1.9 设 二 维 随机 向 量 (X, Y) 的 联合 概率 密度 为 
dry, Oc zr. y«1 
0. 其 它 


f(x, y) = | 


试 求 :D P(X>Y); (2)P(X 一 Y) 。 
E ”积分 区 域 如 图 3.1.4 所 示 。 


P(X>Y)= NETS 
[209 - 3 
= | 2r dr = 5 
© 类 似 于 (1) 可 得 


Pocy-l 


2 
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所 以 
P(X=Y)=1—P(X>Y)—P(X<Y)=0 
这 里 POX—YO —0 可 以 这 样 理解 :由 于 一 维 连续 型 随机 变量 在 一 点 取 值 的 概 
率 为 0, 所 以 类 似 地 有 :二 维 连续 型 随机 向 量 在 一 条 线 取 值 的 概率 为 0。 


练习 3.1 


1. 现 有 10 件 产品 ,其 中 6 件 正品 ,4 件 次 品 。 从 中 随机 抽取 2 次 ,每 次 抽取 1 
件 , 定 义 两 个 随机 变量 X.Y 如 下 : 
ya 1. 第 1 次 抽 到 正品 ya ji 第 2 次 抽 到 正品 
0, 第 1 次 抽 到 次 品 10, 第 2 次 抽 到 次 品 
试 就 下 面 两 种 情况 求 (X,Y) 的 联合 概率 分 布 和 边缘 概率 分 布 。 
(1) 第 1 次 抽取 后 放 回 ; (2) 第 1 次 抽取 后 不 放 回 。 
2. 已 知 10 件 产品 中 有 5 件 一 级 品 ,2 件 废品 。 现 从 这 批 产品 中 任意 抽取 3 
次 , 记 其 中 的 一 级 品 数 与 废品 数 分 别 为 X,Y, 求 C(X,Y) 的 联合 概率 分 布 和 边缘 概 
率 分 布 。 
3. 已 知 随机 变量 X,Y 的 概率 分 布 分 别 为 





S|- 
交加 
vj- 


H P(XY=0)=1, 求 
DX Fl Y 的 联合 概率 分 布 ; 





(2)P(X=Y)., 
4. 设 二 维 随机 向 量 (X. Y) 的 联合 概率 密度 为 
Ae UU". a0. y>0 
flr, y)— 
0, 其 它 
试 求 :(1) 常 数 A; 


OX, VAF X., Y 的 边缘 概率 密度 ; 
(G)PO- X2. 0<Y<3); 

CD POEX-2Y« D; 

(HICK YY 
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5. 设 二 维 随机 向 量 (X, Y) 的 联合 概率 密度 为 


(tiy Onl Oy 
Jie »-—4 3 
t 0, 其 它 


试 求 :(1) (X,Y) 关 于 X,Y 的 边缘 概率 密度 ; 
eP(x«xv«ci). 
6. 设 二 维 随机 向 量 (X, Y) 的 联合 概率 密度 为 
m =f? d rD0,y-c 
fea — xt 
试 求 :(1) (X,Y) 关 于 X, Y 的 边缘 概率 密度 ; 
(2 P(X>2, Y«4). 
7. 某 公 司 经 理 和 他 的 秘书 定 于 本 周 星 期 日 中 午 12 点 至 下 午 1 点 在 办 公 室 会 
面 ,并 约定 先 到 者 等 20 分 钟 后 即 可 离 去 , 试 求 二 人 能 会 面 的 概率 。 


3.2 随机 向 量 的 联合 分 布 函数 


1 联合 分 布 函 数 
定义 3.2.1 B(X, Y) 二 维 随机 向 量 , 称 R 上 的 二 元 函数 
F(x,y)- POXax , Y<y) 

为 (X,Y) 的 联合 分 布 函 数 (joint distribution function) ,简称 联合 分 布 。 

如 果 (X, Y) 为 离散 型 随机 向 量 , 其 联合 概率 分 布 为 

P(X2z,,Y-y)-p, (i=1, 2, “e, j=l, 2，…) 
则 相应 的 联合 分 布 函数 为 
FCz，y) = »» 2b. 

WRX, Y) 为 连续 型 随机 向 量 ,其 联合 概率 密度 为 f(z，y)，, 则 相应 的 联合 分 

布 函数 为 
F(z, y) = Fre Dds dt 

在 这 里 可 以 看 出 ,分 布 函数 FCz，y) 的 值 恰 好 是 随机 向 量 (X, Y) 取 值 于 区 域 

(eec XE. 一 <Y<y) 内 的 概率 , 它 是 随机 变量 X 的 分 布 函数 下 (z) 的 推 


TORERE Cn X ns. Y ye) ,有 
PG, « X & ax, n LYS y) = Fr y) — FG» y) — Fn, 24 FG» y) 
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另外 F(z, y) 一 P(X<+,，Y<y) 可 以 这 样 理解 
FG. y)  PCOX a (Y(Yszy)0) 
因此 FCz，y) 有 如 下 性 质 : 
(OD Ox:FCr, y xl; 
(2)FCF 9206, +œ)=1, FC—-99, —œ)=F(—œ, 0) — F(0, —99)—0, 
定义 3.2.2 X, Y) 二 维 随机 向 量 的 联合 分 布 函数 为 F(z，>y), 则 称 
Fx(x)= FGr, +œ) = P(X S z, Y «E œ) = P(X & x), 
FyGr) = F(t œ, y) = P(X <+ œ, Y < y) = PY & y) 
分 别 为 X 与 Y 的 边缘 分 布 函数 (marginal distribution function) 。 
对 于 f(x，y) 的 连续 点 ,有 


PFa, y), 
uy faea 


2， 随 机 变量 的 相互 独立 性 


在 第 1 章 我 们 研究 了 随机 事件 的 独立 性 ,而 随机 变量 不 过 是 随机 试验 结果 定 
量化 的 描述 ,因此 很 容易 得 到 两 个 随机 变量 X 与 Y 的 独立 性 , 即 X 与 Y 分 别 对 应 
的 所 有 随机 事件 相互 独立 。 

定义 3.2.3 设 (X,Y) 二 维 随机 向 量 ,如 果 对 于 任意 的 a<b, c<d 均 有 

Pla<X<b, c<Y<d)=P(a<X<b) * P(c<Y<d) 
则 称 随机 变量 X 与 Y 相互 独立 。 

在 具体 实际 应 用 过 程 中 ,用 下 面 的 方法 来 判断 随机 变量 的 独立 性 有 时 更 为 方 
便 。 

定理 3.2.1 (1) 若 (X, Y) 为 离散 型 随机 向 量 , 联 合 概率 分 布 为 

P(X—z.Y—y)—p, (i—1.2, =, j=1, 2，…) 
则 X 与 Y 相 互 独立 的 充分 必要 条 件 是 :对 任何 i, j 二 1, 2,… 都 有 
P(X=zx,, Y=y,)=P(X=z;) * P(Y=y,) 
即 
b,—b. tbe 

DEX., Y) 为 连续 型 随机 向 量 , 联 合 概率 密度 为 /(x, y), 则 XX 与 Y 相互 独 
立 的 充分 必要 条 件 是 其 联合 概率 密度 等 于 两 个 边缘 概率 密度 的 乘积 , 即 对 于 任意 
Gr, y) € R ff 

Fia, 3) 9 fiGe) * fly) 

证 下 面 只 证 (2) ,对 于 (1) 留 给 读者 自己 证 明 。 
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必要 性 
因 和 与 了 相互 独立 , 故 依 定义 3. 2. 3 知 :对 于 任意 的 a<b,c<d 均 有 
P(a X«b, c«Y«d)- P(ac X«b) * Pl(c<Y<d) 


PG -cX-—D-Pc«cY«d2- [cone [ros 


b [d 
= fries oodya 
所 以 
» [4 
Pla<X<b,c<Y<a) = [SA fa dyd 


这 里 fiC) fa O0, HKA RER E E ELA fi G0 fi G0 OX, YO fW Ar o 
密度 ,定理 结论 成 立 。 

充分 性 

由 于 f(xyy) ,fi(z)*fi(y) 所 以 


Pa < X «bem «cayo [fo ydydr 
s [a 
= [or codi 


i » 
= [ricoge :| moody 
— Pa « X <b)» PG Yd) 
由 独立 性 的 定义 知 X 5g Y 相互 独立 。 
用 此 定理 可 判别 例 3. 1. 6 中 的 随机 变量 X 与 Y 不 独立 ,而 例 3. 1.7 中 的 随机 
"pd X Y 相互 独立 。 
定理 3.2.2. 若 随 机 变量 X 55 Y 相互 独立 , 则 连续 函数 g(X) 与 4(Y) 也 相互 
独立 。 特 别 地 ,两 个 相互 独立 的 随机 变量 X. 与 了 的 线性 函数 g(X) 与 h(Y) 仍 独 
x. 


此 定理 的 证 明 已 超出 本 书 的 范围 ,但 此 结论 在 今后 学 习 过 程 中 会 经 常用 到 。 


例 3.2.1 设 A.B 为 随机 事件 , 且 PUO T, POD 0, PCS) - 1. 


x=[1， 车 A 发 生 。 x_11， 若 了 发 生 
2， FARRE 0， 车 卫 不 发 生 


RX, Y) 的 联合 概率 分 布 。 
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解 KA 
dul 
_PCA)PCBIA) 63 1 
P(B)=— FAI 1 
6 
所 以 


P(AB)=} x1 = P(A) + PCB) 


BCA ! B 相互 独 立 。 从 而 A 与 B,A 与 B,A 与 B 均 相互 独立 。 即 随机 变量 X 与 Y 
相互 独立 。 又 由 于 





例 3.2.2 设 随 机 变量 X 与 Y 相互 独立 ,下 表 给 出 了 二 维 随机 向 量 (X, Y) 的 


联合 概率 分 布 及 关于 X 与 Y 的 边缘 概率 分 布 中 的 部 分 值 , 试 将 其 余 的 值 填 人 表 中 
的 空白 处 。 








a= dee 
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解 依 题 根 据 上 表 
由 计 一 p1 一 pu 十 pa 一 pu 十 圭 ， 得 加 一 二。 
于 是 由 X 与 Y 的 独立 性 知 

















spa l. =n n3 
rag Ti p: X 
ze Dit mico dll 
p. $a 2 p. =l $23 
1 1 1 3.1 1 
ba Shi baT ba =p: tb s= 37T 
所 以 (X,Y) 的 联合 概率 分 布 为 
Y 
X » > » pi 
L 1 2 dl 
- 24 8 12 4 
il ES k3 ES 
m 8 8 4 4 
1 1 1 
g T 3 1 


在 数理 统计 中 ,经 常 考虑 个 随机 变量 独立 性 ,上 面 这 些 概念 和 定理 均 可 推广 
为 n 个 随机 变量 的 情形 。 


定义 3.2.4 设 (X,,X,,…,，X,) 是 n 维 随机 向 量 ,如 果 对 于 任意 的 ai <b, 
G=1, 2, …), 有 


Plai < X, bia; < Xi bera < Xn < bn) 


= P(a, < X, < b) * Pla < X; < b) PG, < X, < b) 
则 称 这 个 随机 变量 Xi, Xo. n X, 相互 独立 。 
定理 3. 2. 1 的 推广 如 下 。 


(1)n 个 离散 型 随机 变量 X, ，X: ，…，X, 相互 独立 的 充分 必要 条 件 是 :对 任 
fif zi tas ozn A 


P(X: = ti, X: = Ts, X, = n) 
= P(X, = x) * P(X: = x) P(X, = x,) 
(2)n 个 连续 型 随机 变量 Xi. Xos es Xn 相互 独立 的 充分 必要 条 件 是 :它们 
的 联合 密度 等 于 边缘 概率 分 布 的 乘积 , 即 对 任何 n ，z:，…,z,, 有 


Ra 
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由 此 可 以 证 明 :n 个 相互 独立 的 随机 变量 Xi Xo. cns X, PREE MAMKA 
随机 变量 X, > Xo …，X; 也 相互 独立 。 

定义 3.2.5 若 随机 变量 序列 X. Xo …，X,,… 中 任意 mCm 宇 2) 个 随机 变 
量 相互 独立 , 则 称 该 随机 变量 序列 X, Xas …，X,,…: 是 相互 独立 的 ,如 果 对 所 有 
的 X, 服从 相同 的 分 布 , 则 称 Xio Xas eee Xoo … 为 独立 同 分 布 的 随机 变量 序列 。 


3. 随机 向 量 函 数 的 分 布 


在 数理 统计 中 ,对 某 一 随机 现象 的 n 次 观察 或 试验 数据 可 看 作 个 随机 变量 
Xis Xar ees Xa ,在 研究 的 过 程 中 为 了 某 种 目的 常常 需 将 这 些 数据 进行 “加 工 ” 而 
得 到 一 些 新 的 随机 变量 ,这 些 新 的 随机 变量 就 是 X, Xo. ons. X, 的 函数 。 例 如 若 
Xis Xos eee X, 是 对 某 个 未 知 量 y 进行 的 n 次 观测 的 结果 ,由 于 测量 中 误差 的 存 


在 ,所 以 我 们 用 XX, Xes ns X, dd X X00 X og yas 


这 里 随机 变量 X 就 是 X, ，X:，…，X, 的 函数 。 为 此 需要 研究 随机 向 量 函 数 的 分 
布 。 
例 3.2.3 设 随机 变量 X, 与 X; 相互 独立 ,分 别 服从 二 项 分 布 B(n，p) 和 
Bln:，p), 求 Y 一 Xi 十 X, 的 概率 分 布 。 
解 KH Y 的 可 能 取 值 为 0, 1. 2. om m HERF BOO En + 
nm) H X, 与 X: 独立 性 有 
P(Y == »)PUX = ks X = k) 


Dem 


= M Chh A phh Ch ph (op) 


hT 


= » Ch Ch pO prem t 





P(Y—k) =C} n, p' O7 p)n o7 

所 以 Y 服从 二 项 分 布 Bn 十 n,，p)。 

事实 上 ,我 们 从 概率 论 的 意义 很 容易 理解 这 一 结论 。 若 X— BO. p) WI 
项 分 布 的 试验 背景 (n 重 贝 努 里 试验 ) 知 X 表示 在 次 独立 重复 试验 中 事件 A 出 
现 的 次 数 ,而 每 次 试验 中 事件 A 出 现 的 概率 p 不 变 。 因 此 本 例 中 X, 表示 在 次 
试验 中 事件 A 出 现 的 次 数 ,而 每 次 试验 中 事件 A 出 现 的 概率 均 为 p, 所 以 Y= 
X 十 XX 表示 在 mw 十 nz 次 试验 中 事件 A 出 现 的 次 数 ,而 每 次 试验 中 事件 A 出 现 的 
概率 均 为 户 ,于 是 可 知 Y 一 BOm +m, p). 
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本 例 说 明 两 个 相互 独立 的 二 项 分 布 的 随机 变量 的 和 仍然 是 二 项 分 布 , 称 为 二 
项 分 布 的 “可 加 性 ”。 类 似 地 可 证 明 ,Poisson 分 布 也 具有 “可 加 性 ”。 

下 面 考虑 连续 型 随机 变量 和 的 概率 密度 函数 。 

例 3.2.4 设 随机 变量 X, 与 X; 相互 独立 ,其 概率 密度 函数 分 别 为 fi Cn 
万 (zs), 求 Y 一 X X. 的 概率 密度 函数 。 

SED X, 与 X. 相互 独立 ,所 以 随机 向 量 (X,，X;) 的 联合 概率 密度 为 
Sexis a2) — fi Gr * fi Gr TF JEXHEEfI ab. y=r +r: HA 

P(a <Y<b)= Pla< X, +X: <b) 


a l Silai) * falx: )Jdz dzz 


acr 
tn 


= E (neo + 六 (ro)dz dx: 
- | f Go (frio zdy )dz 
z [A ro-a» * f;COdy)dz 
上 式 中 f or * f Code 即 为 Y 的 概率 密度 函数 。 即 
fv — [S fir — x) * f(r)dr 
TE AER (一 y 一 z, 然 后 把 积分 变量 : 再 换 回 到 zz, 又 可 得 到 


fip = j; Sila) * fiCy — x)dr 


例 3.2.5 设 随 机 变量 X, 5j X. 相互 独立 , 且 均 服从 标准 正 态 分 布 N(0, 1), 
R Y — Xs X. 的 概率 密度 函数 。 
解 ” 依 题 知 X, 的 概率 密度 函数 为 


因 X, 5j X. 相互 独立 ,利用 例 3. 2. 4 的 结果 可 知 Y 的 概率 密度 函数 为 
Ao-[ fi — a) * flr)dr 


= f| e ga 


Y £petcegyi 
= že di eae 


lr 


447r A am | eae vnm 
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1 s[ sE ls 
à +(y) 一 Pd 
fry 2 $ PW 


这 是 正 态 分 布 N(0, 2) 的 概率 密度 函数 。 

上 述 结论 对 于 一 般 的 正 态 分 布 也 成 立 , 即 : 随机 变量 X. ~ N Gao. 
Xz 一 N(jz， o1) ELE 87 Sr DU] Y — Xi X2 — N Ga uis oi boi). XAAR 
互 独立 的 正 态 随机 变量 之 和 仍 是 正 态 分 布 , 且 有 关 的 参数 相 加 。 这 个 性 质 称 为 
态 分 布 的 “可 加 性 ”。 用 类 似 的 方法 将 此 结论 推广 为 下 面 更 一 般 的 结果 。 

有 限 个 相互 独立 的 正 态 随机 变量 的 线性 函数 仍 服从 正 态 分 布 。 即 车 
Xi ~N Cms aD i=l, 2, 0s ns H Xis X2s 0s Xn MEIR sais azs ts an 是 不 
全 为 零 的 常数 , 则 有 





Inl 


yx, 一 NC ami» 六 oj 
特别 地 , 若 Xis Xos eo X, 相互 独立 且 均 服从 正 态 分 布 Nuw，, 00 WA 


例 3.2.6 设 二 维 随机 向 量 (X, YO — NGu ，m oi ois pos frs VARKA 
概率 密度 , 则 X 与 Y 相互 独立 的 充 要 条 件 是 p 一 0。 
证 依 题 知 


fico Ms 





V2no 


fy — 





因此 





Po fet) = er cen [- [522 (2228) ] 
充分 性 : 若 o=0, 将 其 代入 [/(x，y) 中 知 对 于 任意 zx,y, 有 
fir 9 fé fl 
这 说 明 X 与 相互 独立 。 
必要 性 : 若 X 与 Y 相互 独立 , 则 有 
Flr, y)— fx(x) * fy(y), —oocz, y« doo 
特别 取 z 一 上 y= 得 
Fas jam Felpi) * feti 
即 
1 1 


2x Vl—pg 270102 
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从 而 知 p= 二 0。 
下 面 从 分 布 函数 与 概率 密度 函数 的 关系 出 发 ,介绍 另 一 种 求 随机 变量 函数 的 
概率 密度 函数 的 重要 方法 一 一 分 布 函数 法 。 
设 随 机 向 量 (X, Y) 的 联合 概率 密度 为 f y), 
记 Z=g(X,Y) 二 X 十 Y, 则 随机 变量 Z 的 分 布 函数 为 
F(z)= P(Z < z) = P(g(X, Y) <z) 


2 J| 6m dns 


gays 





=P(X+Y<z)= 人 rc， y)dzdy 
scr 


将 z 看 作 常数 化 为 二 次 积分 计算 其 值 , 求 出 Z 的 
分 布 函数 下 (z) ,积分 区 域 如 图 3. 2. 1 阴影 部 分 。 再 根 BA 
据 分 布 函数 与 概率 密度 函数 的 关系 ,对 F(z) 求 关于 z 的 导数 即 可 得 到 2 的 概率 密 
度 函 数 f(z)=F z), 

这 就 是 利用 分 布 函 数 法 求 随机 变量 函数 的 概率 密度 函数 的 基本 步骤 ,这 种 方 
法 很 有 代表 性 ,在 求 一 般 随 机 变量 函数 (包括 一 元 或 多 元 ) 的 概率 密度 函数 时 非常 
有 效 , 解 题 时 经 常用 到 ,应 予以 重视 。 

例 3.2.7 设 随机 变量 X 与 Y 相互 独立 ,其 概率 密度 函数 


2 _， 2o 
no-i E no-i uid 
o. RE 
R Z= V 灰 干 殉 的 概率 密度 函数 。 
解 设 (X,Y) 的 联合 概率 密度 函数 为 


Ept, x0, y»0 
fG.3)— fsGO * fy) —4 & 


0, 其 它 
因此 当 2—0 时 ,Fz(z) 一 0, 从 而 fz(2)=0. 
M OH 
Fz(z)= re， ydrdy = i li e P drdy 

E "mon 

= E [ aof erar 
ala “Jo 

=1—e™ 
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fz(2)=F’z(z)=2ze * 
故 Z 的 概率 密度 函数 为 


E 
fot "T, zz0 
0, z<0 


63.2.8 设 随机 向 量 (X, Y) 服 从 区 域 D— (Gn. W111<z<3, 1<y<3} 上 
的 均匀 分 布 , 求 U=|X 一 Y| 的 概率 密度 函数 。 
SR (X,Y) 的 联合 概率 密度 函数 为 
1 
rot 
0, 其 它 
因此 当 uso Hf, Fu) —0; 
当 0<u<2 时 ,积分 区 域 如 图 3. 2. 2 阴影 
部 分 ,于 是 有 


FG)-— li f, y) dzdy 


ir yin 





当 u>2 if, F(u)=1. 

故 Z 的 概率 密度 函数 为 

jn [t 0<u<2 
0, 其 它 

例 3.2.9 设 某 种 型 号 的 晶体 管 的 寿命 (以 小 时 计 ) 近 似 地 服从 正 态 分 布 
N(160,，20:) , 现 从 中 随机 取 4 只 , 求 其 中 没有 1 只 晶体 管 的 寿命 小 于 180 小 时 的 

解 设 Xi(i 一 1, 2, 3, 4) 表 示 第 :只 晶体 管 的 寿命 ,于 是 X,(i 二 1, 2, 3. 4) 相 
互 独立 , 且 同 正 态 分 布 N(160，20:) ,其 概率 密度 函数 均 为 
i ue? 


h= 
T20 Ji 





因此 所 求 概率 为 
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P(min(X;, X;. Xi, X) > 180) 
= P(X, > 180, X; > 180. X; > 180, X, > 180) 
= P(X, > 180) » P(X: > 180) * P(X, > 180) * P(X, > 180) 











+ 人 
2) [[.. Tn ar] 
pa [: -e(189 199] 
一 [1 一 @(1)] 
= (1—0. 8413)' 
= 0. 00634 
练习 3.2 


w|- 


1. 设 随机 变量 X 5 Y d tb rre. HPOX-——D-PQ--D- 
PX=D=PY=D=4 WC D). 
(A) POC-Yo- 3 (B) P(X=Y)=1 


(©) P(X+Y=0)= (D) Pav-pD-l 


1 
4 
2. 设 随 机 变量 X, (i 二 1, 2, 3. 4) 相 互 独立 同 分 布 , 且 P(X 二 0)=0.6， 


X X |s 
X, X j 


3. 设 二 维 随机 向 量 (X, YO OA REJE KR D— (Gr. y) [0S <2, 0 yel). E 
的 均匀 分 布 , 且 





P(X —1)—0. 4G —1, 2. 3, 4) , 求 行列 式 x-| 


0, X«Y Si X<2Y 
1, X>Y 1, X22Y 
求 U 与 V 的 联合 概率 分 布 。 
4. REJ 3.1 585 4,5.6 题 中 (X, Y) 的 联合 分 布 函数 。 
5. 设 二 维 随机 向 量 (X, Y) 的 联合 概率 密度 为 
47y， Oxr«l. 0<y<l 
flz, »-| 其 它 
RX. Y) 的 联合 分 布 函数 。 
6. 设 随 机 变量 X tj Y 相互 独立 ,其 概率 密度 函数 分 别 为 
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1, USEK Ae^?, y»0 
让 (一 ov xu fT V vxo 
求 :(1) 常 数 A; 
(2) 随 机 变量 Z—2X--Y 的 概率 密度 函数 。 


7. 设 (X, Y) 的 联合 分 布 函数 为 
FG, 3) — ACB-Farctan 3) (C-Farctan T) 


R: DEAA, B, C; 

(2) (X,Y) 的 联合 概率 密度 ; 

GO (X,Y) 的 边缘 分 布 函 数 和 边缘 概率 密度 ; 

(4) POX 3), P(Y<4), P(X<3, Y<4); (5) 判断 X 与 Y 的 独立 性 。 

8. 设 某 仪器 由 两 个 部 件 构成 ,用 XY. 分 别 表示 两 个 部 件 的 寿命 (单位 : 千 小 
时 ) CR OX. Y) 的 联合 分 布 函数 为 

_ -es—e +e et x0, y0 
FG, »-| ó; 其 它 

试 求 :(1) 求 (X, Y) 的 两 个 边缘 分 布 函 数 ， 

(2) 求 (X,Y) 联 合 概率 密度 与 边缘 概率 密度 ; 

(3)X S Y 是 否 独 立 ; 

(4) 两 个 部 件 寿命 都 超过 100 小 时 的 概率 。 

9. EX '3 Y 相互 独 立 , 且 XX 服从 4 二 3 的 指数 分 布 ,Y 服从 4 二 4 的 指数 分 
布 , 试 求 : 

(1) (X,Y) 联 合 概率 密度 与 边缘 概率 密度 ; 

(P(X<I1, YD; 

GNX, Y) f£ D— (Gr. y| x20, y>0, 31 Ay —3) UE BS BOR, 

10. 对 随机 变量 X,Y 有 


P(Xz0, Y20)— 


-lw 


P(x>0)=P(Y>0)=4 


R P{max(X, Y)>0}, Pimin(X, Y)<0}. 
11. OX, Y) 的 联合 概率 密度 为 
3z， 0<z<1, 0<y<z 
fix. y= 


0, 其 它 
X Z— X —Y 概率 密度 函数 。 
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3.3 条 件 分 布 


对 于 二 维 随机 向 量 (X, Y) 而 言 ,随机 变量 X 的 条 件 分 布 是 指 在 给 定 Y 取 某 
个 值 的 条 件 下 X 的 分 布 。 如 设 X 表示 人 的 体重 ,Y 表示 人 的 身高 , 则 XX 与 Y 之 间 
一 般 有 相依 关系 。 现 在 若 限 定 Y==1.7 米 , 在 此 条 件 下 体重 X 的 分 布 显然 与 无 此 
限制 下 X 的 分 布 是 不 同 的 。 


1. 离散 型 随机 变量 的 条 件 分 布 列 


设 二 维 离散 型 随机 向 量 (X, Y) 的 联合 分 布 列 为 
ps=P(X=z,, Y=y;), i=1, 2, =, j=l, 2, = 
仿照 条 件 概率 的 定义 ,容易 给 出 如 下 概念 。 
定义 3.3.1 对 一 切 使 P(Y— y) — p.,—Xp,7»0 fl y, f 


POX—n.Yo Py. ol. e 
C PYsy »! 1,2, 





pi;=P(X=zx;|Y=y;)= 
ANGE Y — y, REF X 的 分 布 列 。 


同样 可 以 定义 给 定 XS a 条 件 下 Y 的 分 布 列 。 
例 3.3.1 设 二 维 离散 型 随机 向 量 (X,Y) 的 联合 分 布 列 为 


























试 求 给 定 X 一 1 REF Y 的 分 布 列 。 
解 因为 POX— D — pi. 二 0.6, 所 以 用 第 一 行 各 元 素 分 别 除 以 0. 6, 就 可 以 得 
到 给 定 X—1 RF Y 的 条 件 分 布 列 为 


YIX=1 1 | 3 
1 1 
il E 3 


同 理 可 以 得 到 :给 定 X—2 ARTE F Y 的 条 件 分 布 列 , 给 定 Y=1 条 件 下 X 的 条 





|=| ~ 








~ 
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件 分 布 列 , 给 定 Y 一 2 条 件 下 X 的 条 件 分 布 列 ,给 定 Y 一 3 条 件 下 X 的 条 件 分 布 
列 。 

从 这 个 例子 看 出 ,二 维 联合 分 布 列 只 有 一 个 ,而 条 件 分 布 列 有 5 个 。 若 X 与 
Y 的 取 值 更 多 , 则 条 件 分 布 列 也 更 多 。 每 个 条 件 分 布 都 从 一 个 侧面 描述 了 一 种 状 
态 下 的 特定 分 布 。 可 见 条 件 分 布 的 内 容 丰 富 ,其 应 用 也 更 广 。 


2. 连续 型 随机 变量 的 条 件 分 布 密度 函数 


设 二 维 连 续 型 随机 向 量 (X, Y) 的 联合 密度 函数 为 S, y) ,边缘 密度 函数 分 
别 为 fx GO. fy(y)。 
定义 3.3.2 对 一 切 使 f» 070 的 y SE Y — y 条 件 下 X 的 条 件 密度 函数 
为 
falyp 2f» 


fy» 

对 一 切 使 /x 22-0 的 ,给 定 X= 工 条 件 下 Y 的 条 件 密 度 函 数 为 
_ fz; y) 
Fala Fz) 


例 3.3.2 BCX, Y) 服 从 单位 圆 面 上 的 均匀 分 布 , 试 求 给 定 Y=y> 条 件 下 X 
的 条 件 密度 函数 为 /(z|y)。 
解 因为 
Li 
fas ned M E 
0, 其 它 


由 此 得 Y 的 边缘 密度 函数 为 


4 o VKITy, -—1€y«l 
«oy 
0, XU 


所 以 当 一 1 二 y<1 时 ,有 





1 
， Vl—y<r<Vl—y 
rn- MET d 
0, HE 
若 将 y=0 f y—0.5 分 别 代入 上 式 可 得 
1 


fais=0 =f?" 
0, 
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fisco Me 2 
0, RE 


Lo Eg luu 


这 是 两 个 均匀 分 布 的 密度 函数 。 

进一步 可 见 : 当 一 1 二 y 二 1 时 ,给 定 Y==y RFX 服从 (一 VI 一 ”， 
V1 一 y) 上 的 均匀 分 布 。 同 理 有 : 当 一 1 二 x 二 1 时 ,给 定 X — mr 条 件 下 ,Y 服从 
(一 VI 二 x， V1 一 z7) 上 的 均匀 分 布 。 


1&2] 3.3 


1. 设 二 维 离散 型 随机 向 量 (X, Y) 的 联合 分 布 列 为 








1 0.1 o3 | o2 





2 0.2 0.1 0.1 


WORA E X—2 TET Y 的 分 布 列 。 
2. 设 二 维 连续 型 随机 向 量 (X,Y) 的 联合 密度 函数 为 
[0 0<y<r 
fiz, y) | 全 Et 
求 条 件 密度 函数 Olr). 
3. 设 二 维 连续 型 随机 向 量 (X, Y) 的 联合 密度 函数 为 
fos -人 yl x. 0<z<1 


0, 其 它 
求 条 件 密 度 函数 f(z|y)。 
4. 设 随机 变量 X 与 Y 相互 独立 , 且 X~ A), Y~ P). WEH AE E A 


X+Y 一 "的 条 件 下 ,X 服从 二 项 分 布 有 On, ph po e. 


5. 设 在 一 段 时 间 内 进入 某 一 商店 的 顾客 人 数 X 服从 泊 松 分 布 P OO ,每 个 顾 
客 购买 某 种 物品 的 概率 为 p, 并 且 各 个 顾客 是 否 购买 该 种 物品 相互 独立 , 试 证 明 进 
入 商店 的 顾客 购买 这 种 物品 的 人 数 Y 服从 参数 为 4p 的 泊 松 分 布 。 

6. 试 证 明 二 维 正 态 分 布 的 条 件 分 布 是 一 维 正 态 分 布 。 
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随机 变量 的 取 值 是 不 确定 的 ,但 随机 变量 的 变化 又 有 自己 的 统计 规律 性 。 规 
律 性 之 一 就 是 在 前 两 章 介绍 的 可 以 具体 、 细 臻 地 描述 随机 变量 的 概率 分 布 或 概率 
密度 (一 般 情 况 下 它们 很 难 求 得 ); 规 律 性 之 二 就 是 在 主要 概率 特征 上 表现 出 的 稳 
定性 。 这 种 稳定 的 随机 变量 的 特征 往往 比 全 面 的 概率 分 布 (或 概率 密度 ) 更 直接 、 
更 简洁 、 更 清晰 、 更 实用 地 反映 出 随机 变量 的 本 质 。 

商店 出 售 的 每 瓶 食油 的 净 含量 是 不 同 的 ,是 个 随机 变量 。 而 每 瓶 食油 的 商标 
上 只 是 标 有 : 净 含量 5000 毫升 士 5%。 这 里 的 5000 毫升 并 不 是 该 瓶 食油 的 实际 净 
含量 (逐个 标 出 每 瓶 油 的 实际 净 含 量 也 是 不 实际 的 ) ,而 是 该 批 食油 每 瓶 的 平均 净 
含量 (数字 特征 ) , 士 5% 是 每 瓶 食油 实际 净 含 量 与 平均 净 含量 的 差 。 实 际 上 ,顾客 
知道 了 商标 上 的 数字 特征 就 可 以 对 所 买 的 食油 有 整体 的 了 解 。 

商店 里 出 售 的 衣服 一 般 只 有 几 种 规格 :L,XL,XXL,…, 而 这 些 代 码 和 数字 正 
是 某 类 人 和 群 身体 的 尺寸 (随机 变量 ) 的 特征 ,人 们 可 以 根据 自己 的 特征 去 买 衣服 。 
量体裁衣 定做 衣服 当然 好 ,但 是 没有 特殊 需要 时 ,大 多 数 人 们 还 是 到 商店 去 买 。 

可 见 在 日 常生 活 中 遇 到 大 量 的 是 与 随机 变量 数字 特征 有 关 的 实际 问题 。 

另外 ,在 后 面 的 学 习 过 程 中 ,我 们 还 会 发 现 随机 变量 的 数字 特征 大 多 是 概率 分 
布 (或 概率 密度 ) 中 的 参数 ,这 样 一 旦 知道 了 数字 特征 ,也 就 知道 了 其 对 应 的 概率 分 
布 (或 概率 密度 ) 。 正 因为 如 此 ,在 数理 统计 中 我 们 还 要 对 这 些 数字 特征 进行 估计 

本 章 主 要 讨论 随机 变量 的 期 望 .方差 . 协 方差 .相关 系数 及 其 应 用 。 最 后 还 介 
绍 了 作为 概率 论 经 典 结论 和 数理 统计 理论 基础 的 大 数 定律 和 中 心 极限 定理 。 

通过 本 章 的 学 习 , 要 注意 在 遇 到 复杂 问题 时 善于 抓 特征 ,看 本 质 , 去 粗 取 精 , 培 
养 一 种 良好 的 思维 方法 和 工作 方法 。 
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4.1 随机 变量 的 数字 特征 


1. 数学 期 望 


“平均 数 ?是 我 们 在 日 常生 活 中 使 用 最 多 的 一 个 数字 特征 , 像 * 平 均 身 高 "“ 平 
均 亩 产量 "平均 产 值 "“ 平 均 成 绩 "等 等 。 它 简明 地 指出 所 研究 对 象 的 位 置 特征 ， 
对 评判 事物 ,作出 决策 都 有 很 重要 的 作用 。 例 如 10 月 1 日 某 商 场 准备 搞 促销 活 
动 , 统 计 资 料 表明 ,如 果 在 商场 内 搞 促 销 活动 ,可 获得 经 济 效 益 3 万 元 ,在 商场 外 搞 
促销 活动 ,如 果 不 遇 到 雨天 可 获 经 济 效益 12 万 元 ,如 果 遇 到 雨天 则 带 来 经 济 损失 
5 万 元 。9 月 30 日 的 天 气 预报 称 当地 有 雨 的 概率 为 40% ,那么 商场 应 该 选择 哪 种 
促销 方式 呢 ? 显然 在 商场 外 搞 促 销 活动 的 经 济 效益 X 是 个 随机 变量 ,其 概率 分 布 
为 

P(X—12)—0.6, P(X——5)—0.4 
要 作出 决策 就 要 将 此 时 的 平均 效益 与 3 万 元 比较 。 又 如 何 求 平均 效益 呢 ? 要 想 全 
面 客观 地 反映 平均 效益 就 须 既 要 考虑 X 的 所 有 取 值 , 又 要 考虑 X 取 每 一 个 值 时 的 
概率 , 即 为 
12X0. 6+(—5) X0. 4=5. 2( 万 元 ) 

平均 效益 5. 2 万 元 即 为 X. 的 数学 期 望 。 


(1) 离 散 型 随机 变量 的 数学 期 望 
定义 4.1.1 设 离散 型 随机 变量 X 的 概率 分 布 为 
P(X=zi)=p: (k=1, 2，…) 


ALBAS npa 绝对 收敛, 则 称 > xipk 为 X 的 数学 期 望 (mathematical 
expectation) ,简称 期 望 或 均值 (meanj , 记 作 ECX), 即 ECX) = Yapa. 如果 


laps 不 是 绝对 收 仇 , 即 级 数 on | ps 发 散 , 则 称 X 的 数学 期 望 不 存在 。 


定义 中 “绝对 收敛” 这 一 条 件 , 是 为 了 保证 不 管 cs 的 次 序 如 何 改变 ,级 数 都 应 
收敛 , 且 收 敛 于 同一 数值 .显然 对 于 一 个 随机 变量 的 分 布 列 来 说 ,这 一 要 求 是 合理 
的 。 

数学 期 望 实际 上 是 以 概率 p. 为 权 的 加 权 平 均值 , 当 pi 为 同一 数值 时 ,数学 期 
望 即 为 算术 平均 值 .数学 期 望 是 不 变 的 常数 ,而 不 再 随机 。 

例 4.1.1 设 随机 变量 X 服从 参数 为 户 的 0- 1 分布 , 求 E(X)。 
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解 ”由 题 意 知 ,X 的 分 布 列 为 
P(X=k)= p O—p)* (k=0, 1) 
TE EOD-O- (1 一 p)+1. p—p. 

例 4.1.2 设 随机 变量 X 服从 二 项 分 布 , 即 X— BO, p R ENX). 

解 ”由 上 题 知 0-1 分 布 的 期 望 是 p, 而 二 项 分 布 是 个 相互 独立 的 具有 相同 
概率 p 的 0-1 分 布 的 和 。 可 以 猜想 一 下 ,二 项 分 布 的 数学 期 望 是 否 为 np? 下面 
我 们 用 定义 来 计算 。 

依 题 知 X 的 分 布 列 为 

P(OX—k)—Cip(1— 507^, k=0, 1, 2, sn 
于 是 有 


E(X)= 2s . Œp ad pn 


=- BD. Ha tpi, cg 


_ np(n— 1)! 


i udin 
G-DIa-D-G-DJ^ 0-P» 





amd 
aoc mp SAC rao py 





= np 
最 后 一 个 等 式 成 立 可 以 从 下 面 两 方面 来 证 明 。 
一 方面 ,由 二 项 式 展开 公式 有 : 


= 
Dop a- pret p+ DI 21 


另 一 方面 ， 2) CC p O— pE 可 以 看 成 是 二 项 分 布 BC 一 1, p) 中 所 有 


概率 之 和 。 由 概率 分 布 的 性 质 ,其 值 等 于 1. 利 用 这 一 性 质 计算 随 机 变量 的 数字 特 
征 是 常用 的 方法 。 
例 4.1.3 设 随 机 变量 X 服从 Poisson 分 布 , 即 X—PGO , 求 ECX)。 
解 ”求解 的 过 程 和 道理 与 上 题 类 似 , 此 处 不 再 详 加 说 明 。 
依 题 知 X 的 分 布 列 为 
P(X = = (Q0. —0,1.2, 7) 


于 是 有 
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saD pama e=) 
例 4.1.4 XR?" i I EHER E RODER BURMA Poisson 分 布 ,平均 每 件 上 有 
0.8 PIER. HIERAR 1 个 为 一 等 品 , 价 值 10 TEAKE 1 个 不 
多 于 4 个 为 二 等 品 ,价值 8 元 ; 意 点 数 超 过 4 个 为 废品 ; 求 :@ 产 品 的 废品 率 ;@ 产 
品 价值 的 平均 值 。 
解 ” 设 XX 代表 每 件 产品 上 的 疲 点 数 ,由 题 意 知 :E(X) 二 0.8, 即 4 二 0. 8。 


f 
u es 一 0.001412, 所 以 产 





@ 因为 P(X>4) 一 1 一 P(X 和 4 一 1 一 2) 
e 


A I BE A SE 0. 001412, 
Qt Y 代表 产品 的 价值 ,那么 Y 的 概率 分 布 为 


Y 10 8 0 





T 
P P(X<1) Püacx«o P(X>4) 


所 以 产品 价值 的 平均 值 为 
E(Qy)— 10X PX X D 8X P(1 X «& 0X POC 4) 


1 a 
- 9.8* 0. . 0.8* T E 
一 lox 之 pee "EX "PSU +O = 9.6160 


(2) 连 续 型 随机 变量 的 数学 期 望 
3EX 4.1.2. 设 连续 型 随机 变量 X 的 概率 密度 为 f(x), 如 果 广 义 积分 


| rrGzydz 绝 对 收敛 , 则 称 | af ode o X 的 数学 期 望 ,简称 期 望 或 均值 , 记 作 


E(X), 即 ECX) = BEC 


连续 型 随机 变量 数学 期 望 的 定义 是 离散 型 随机 变量 数学 期 望 定 义 的 拓展 ,只 
要 应 用 定 积分 的 定义 和 中 值 定理 就 可 以 得 到 . 它 只 不 过 是 将 离散 的 级 数 运 算 变 为 
相应 的 连续 的 积分 运算 。 

例 4.1.5 设 随 机 变量 XX 服从 [a, 5] 上 的 均匀 分 布 , 求 E(X)。 

解 ” 由 题 意 知 ,X 的 概率 密度 函数 为 


Fa) d axLr«b 
z)= 


0, 其 它 





于 是 有 
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EW = | afda -| 


例 4.1.6 设 随机 变量 X IRA S CN A 的 指数 分 布 , 求 ECX) 。 


解 ”由 题 意 知 ,X 的 概率 密度 函数 为 
pets x0 
| 0, z0 








fou 


于 是 有 
EC(X)= 小 sid E= f Are dr 


最 后 一 个 等 式 又 用 到 概率 密度 的 性 质 | /Cz)dz 一 1 。 


例 4.1.7 设 随 机 变量 X 服从 正 态 分 布 N(y, 60 REX). 
解 ”由 题 意 知 ,X 的 概率 密度 函数 为 


P= ,one os 


V2xa 





于 是 有 





E(X)= J; af (ajdt = f z E e dr 
B t TO 


PS 


o 








pum n a 
一 一 ye * dy | edy 
zal- "l n 
=0+p 
=y 


特别 地 , 当 X~N(0, 1) 时 ,ECX) 一 0。 

以 上 推导 的 几 种 常见 重要 分 布 的 数学 期 望都 和 它们 分 布 中 的 参数 有 关 , 以 正 
态 分 布 为 例 , 参 数 y 正 是 它 的 期 望 。 我 们 知道 , 正 态 分 布 的 密度 函数 曲线 以 直线 
二 J 为 对 称 轴 , 当 x 二 jy 时 ,f(x) 达 到 最 大 值 。 因 此 这 一 结果 从 直观 上 说 ,也 是 很 
自然 的 (如 图 4.1. D. 


例 4.1.8 设 随 机 变量 X~ fa), E=] MH 


Sl 
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fG) fG) 
[7] «T t Oo z 
X~N(p,°) E(X)=p X—N(0,1)) E(X)=0 
图 4.1.1 


ar+b, 0<z<l 


£o - | 0, 其 它 


3X a 5 b 的 值 ;并 求 分 布 函 数 F(z)。 
解 ”由 题 意 知 


[T sodz = f'ar tode = +6=1 
a | tiis r p d ee 
EOD = | zf (æd = [star +de = $+ = 
解 方程 组 得 a 一 1,6 一 十 。 
M osa it, A 
el 三 让 
FG) -| fd = [o 二 df 一 到 十 


TS 


所 以 
0， z<0 


Fia) = ic». bgaa 


i z>1 
应 该 指出 ,并 非 所 有 随机 变量 都 有 数学 期 望 ,例如 XX 的 密度 函数 为 


f(z7)= 一 co<z<< 十 co 


DE 
za 
由 于 广义 积分 

i = " 

| |z | fdz = Ż f" 2 de= nait] —He 

i xls z i 


lc 
发 散 ,所 以 E(X) 不 存在 。 
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(3) 随 机 变量 函数 的 数学 期 望 

在 实际 问题 中 ,我 们 经 常 需要 计算 随机 变量 函数 的 数学 期 望 。 下 面 不 加 证 明 
给 出 几 个 有 关 的 定理 。 

定理 4.1.1 设 X 是 随机 变量 ,Y 一 &(CX) OFF. E(Y) 存 在 , 则 

CD 若 X 为 离散 型 随机 变量 ,其 概率 分 布 为 

P(OX—z)—p. k—1.2.77 
Ju Y 的 数学 期 望 为 
EQO-EGOD) = ga) ps 
@ F X 为 连续 型 随机 变量 ,其 概率 密度 为 Go 0 Y 的 数学 期 望 为 
EY) —EQOD) =| +2 gle) f Go) dx 

这 两 个 公式 的 重要 性 在 于 : 当 计算 g(X) 的 期 望 时 ,不 必 先 求 出 g(X) 的 分 布 ,而 直 
TORUM X 的 分 布 来 计算 E[g(X)], 很 方便 。 对 于 随机 向 量 来 讲 ,也 有 类 似 的 结论 。 

定理 4.1.2 设 (X,Y) 是 二 维 随机 向 晤 ,Z JE X. Y BRE Z—g CX. Y). 
H. E(Z) 存 在 , 则 

CD 若 (X, Y) 为 离散 型 随机 向 量 ,其 概率 分 布 为 

P(X—z,, Y=y;,)=pþ;, i, 7 一 1，2，… 
则 Z 的 数学 期 望 为 
E(Z) = E(g(X, Y) = S33 gis Y) Pa 

© 若 (X, Y) 为 连续 型 随机 向 量 ,其 联合 密度 函数 为 f(z，?), 则 Z 的 数学 期 

HUS 
E(Z) = E(g(X, Y) =Í f (Gr yfr, Wdrdy 

例 4.1.9 设 随 机 变量 X 在 [0, xz] 上 服从 均匀 分 布 , 求 ECsinX), EXOR 

E[X—E(X)]’. 


解 ”由 定理 4.1.1, 有 
E(sinX) = 1 


"sinzf dz = [sinz . lag 一 工 (一 cosz)| = 
o n n o 





EX» = f esw dr = f 


TRAE S 
a 元 dz 3 


l jr = X 
E 
z 12 
对 于 上 面 计算 EXO & ELOX E) Y* 的 方法 ,在 后 面 方差 的 计算 中 还 要 用 
到 ,请 大 家 予以 重视 。 


例 4.1.10 假定 国际 市 场 每 年 对 我 国 某 种 商品 的 需求 量 是 一 个 随机 变量 X. 





ELX 一 ECX)] = EX - E = fe- Ll». 
i 
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《单位 : 吨 ), 它 服从 [2000,4000] 上 均匀 分 布 ,已 知 该 商品 每 售 出 1 吨 , 可 获 3 万 元 
的 外 汇 , 但 若 销售 不 出 去 , 则 每 吨 要 损失 各 种 费用 1 万 元 ,那么 如 何 组 织 货 源 , 才 可 
使 收益 最 大 ? 

解 设 y 为 组 织 的 货源 数量 ,Y 为 收益 ,显然 收益 Y 是 销售 量 X 和 组 织 货源 
数量 y 的 函数 ,由 于 X 是 随机 变量 ,所 以 收益 Y 也 是 一 个 随机 变量 (组 织 货源 量 y 
不 是 随机 变量 )。 由 于 X 服从 [2000, 4000] 上 的 均匀 分 布 , 因 此 只 需 在 [2000， 
4000] 上 考虑 。 依 题 有 

Se - 3», M XLyM 
fed ne 当 X<y M 
TR 
EY) = E(g(X)) = [T esad = zoo]. ende 
- za]... n — yr zx], 3 ydr 


=l 
1000 


由 微 积分 知识 可 算出 : 当 y= 3500 时 E(Y) 最 大 ,因此 应 组 织 3500 吨 的 商品 。 

例 4.1.11 设 某 商店 经 营 一 种 商品 ,每 周 的 进货 量 X 和 顾客 对 该 种 商品 的 需 
求 量 Y 是 两 个 相互 独立 的 随机 变量 , 均 服 从 [10, 20] 上 均匀 分 布 ,此 商店 每 售 出 一 
个 单位 的 商品 可 获 利 1000 元 ,车 需求 量 超 过 进货 量 ,可 从 其 它 商店 调剂 供应 ,此 时 
售 出 的 每 单位 商品 仅 获 利 500 元 , 求 此 商店 经 销 这 种 商品 每 周 获 利 的 期 望 。 

解 ”此 题 与 上 例 不 同 ,这 是 一 个 二 维 随机 向 量 问题 。 设 此 商店 经 销 该 商品 每 
周 可 获 利 工 元 。 依 题 有 

-| 1000Y, Y«x 
1000X--500(Y—JXO. Y>X 
ij CX. Y) 的 联合 概率 密度 为 


C— y! + 7000 — 4000000) 


1 
fG. »-] 100' 
0. 其 它 
所 以 
E= [Ir 2d, jidai 


b 


l 1 
= [11000y X 一 一 500 十 一 一 
[ » 100dzdy +f (z+y) Xx 100dzdy 
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B. "NT 
=f df loydy 十 | as ed 
Mdh ue. 
è gm 
2 sf GP — 100) dz + E [Gc +20)? — 42^ Jdr 
, y 


= s +7500 


= 14167 
故 该 商店 经 销 这 种 商品 每 周 的 期 望 获 利 14167 元 。 
例 4.1.12 设 (X,Y) 的 联合 概率 分 布 为 : 














R E(X), E(Y),E(X * Y). 
R EDREOORLEOO WERE X 和 了 的 边缘 分 布 。 关 于 X MY 的 边缘 
分 布 为 











0 1 2 3 
3 1 Jd. Em. o eL 
P o r£» 5 | 3 8 8 8 
那么 有 
ajs? d eed 
ECO-IXTE3X4 2! 
1 3 3 led. 
EQO-0Xgq FlXq-2Xg343Xq4—7: 


EX- Y= QXO XO-- OX DX $ X2 X $E OX D X04 


(3X0) X 4-GXDXO0H-GX2X0GX32x1 


9 
E 
对 于 上 面 计算 E(X。Y) 的 方法 ,后 面 协 方差 的 计算 中 还 要 用 到 ,请 读者 予以 
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重视 。 


(4) 数 学 期 望 的 性 质 
从 以 上 有 关 数 学 期 望 的 定义 和 定理 出 发 ,我 们 进一步 来 讨论 数学 期 望 的 一 些 
其 它 性 质 。 假 设 下 面 所 用 到 的 期 望都 存在 。 
性 质 1 如 果 C 是 一 个 常数 , 则 
E(C)=C 
性 质 2 如 果 义 是 随机 变量 ,a,b 是 常数 , 则 
ElaX+b)=aE(X)+b 
性 质 3 如果 (X,Y) 是 二 维 随机 向 量 , 则 
E(XEY) - EOO E ECY) 
性 质 4 如 果 (X, Y) 是 二 维 随机 向 量 , 且 X A Y 相互 独立 , 则 
E(X + YO -EOO * E(Y) 
证 这 里 只 证 明 性 质 2 和 性 质 4 ,性质 1 和 性 质 3 留 给 读者 。 
性 质 2 的 证 明 ( 这 里 只 对 离散 型 的 情形 证 明 ) 。 
设 X 的 概率 分 布 为 忆 (X 一 zx) 一 各 (一 1，2，…) ,由 定理 4.1.1 有 





El Fb) D tatom — alibi bla 
zi = c 
— aEQO 4-b 
性 质 4 的 证 明 ( 这 里 只 对 连续 型 的 情形 证 明 ) 。 
BOX, Y) 的 联合 密度 函数 为 f(z,y) ,其 边缘 概率 密度 分 别 fx(z) 和 fv OD. 
由 定理 4. 1. 2 知 
E(X.Y)= f a agf(m y) didy 

因为 X 和 Y 相互 独立 ,f(z,y) 二 fx(r)*。fy(y), 所 以 有 

EX-Y- aja xyf x GO fy GO dzdy 


- f xf (adr + f yfy Cody 
= E(X) + EY) 
对 于 性 质 3 和 性 质 4 可 以 推广 到 有 限 个 随机 变量 的 情形 , 即 对 于 ”之 2, 同 样 
有 
EG 十 X; XO = EOG) H-EOGO d- + ECCO 
Wi XQ. Xo. e. X, 相互 独立 时 ,类 似 地 有 
EGG * Xa + = XO—EQGQ) 。 E(X) + = + ECX,) 
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性 质 4 的 逆 命题 不 成 立 , 即 :如 果 X 55 Y EEX + Y) -ECO * EY), BA 
X 与 不 一 定 相 互 独立 。 例 如 在 例 4.1.12 中 EX + Y) 一 ECX)。E(Y) 一 全, 但 


P(X=1,Y=0)=0, 而 PIX=D) P(Y 一 0) 一 这 ,所 以 X 与 Y 不 独立 。 


例 4.1.13 试用 性 质 计算 例 4.1.9 中 的 ELX- EGO. 
解 ” 由 性 质 知 

E[X — EOOY = E[X! -2bO0 + X-- E'OO] 
E(X?) — 2bO0 * E(X) +E? (X) 
= EX) — E(X) 


例 4.1.14 一 次 数学 测验 由 40 个 单项 选择 题 构 成 ,每 个 选择 题 有 4 个 选项 ， 
每 题 选择 正确 答案 得 2. 5 分 ,否则 0 分 ,满分 100 分 。 学 生 甲 选 对 任 一 题 的 概率 为 
0.8, 学 生 乙 则 每 次 都 从 4 个 选项 中 任 选 一 个 。 分 别 求学 生 甲 和 乙 在 这 次 数学 测验 
中 的 期 望 成 绩 。 
RS ” 设 学 生 甲乙 在 测验 中 选 对 题 的 个 数 分 别 为 X 与 Y, 则 所 得 的 成 绩 分 别 
39 2.5X 5 2.5Y. HF X — B(40, 0.8),Y~B(40, 0.25), 所 以 
EC(X) —40X0. 8—32, E(Y) —40X0. 25—10 
于 是 学 生 甲 和 乙 的 期 望 成 绩 分 别 为 
E(2.5X) = 2.5X E(X) = 2.5 X 32 = 80 
E(2.5Y) — 2.5X E(Y) — 2.5 X 10 — 25 


2.97 差 


随机 变量 取 值 的 稳定 性 是 判断 随机 现象 性 质 的 十 分 重要 的 指标 。 例 如 某 地 区 
地 震 仪 上 描 出 的 曲线 如 果 起 伏 很 大 ,这 说 明 该 地 区 地 下 活动 异常 ,是 地 震 的 预兆 ; 
某 天 股市 中 股票 价格 出 现 异常 波动 ,这 就 预示 着 社会 经 济 中 将 有 重大 事件 发 生 ; 一 
台 仪 器 在 测量 某 一 元 件 的 某 数 量 指标 时 , 若 在 多 次 测量 中 数据 的 差异 很 大 , 则 说 明 
该 仪器 存在 质量 问题 , 需 修理 或 更 新 了 。 因 此 如 何 衡量 随机 变量 的 稳定 特征 在 现 
实生 活 中 意义 重大 。 


(1) 方 差 的 基本 概念 和 性 质 
定义 4.1.3 设 X 是 随机 变量 ,期 望 E(CX) 存 在 ,如 果 E[X 一 E(X)J 存在 , 则 
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ELX—ECO ]' 称 为 X 的 方差 (variance) , 记 作 D(X), 即 
D(X)=E[X—E(X)] 

而 VD(X) 称 为 X 的 标准 差 (standard deviation)。 

由 方差 定义 的 数学 表达 式 可 以 看 出 ,方差 实际 上 是 随机 变量 X 与 它 均值 
E(X) 差 的 平方 的 期 望 值 , 它 的 大 小 自然 可 以 衡量 随机 变量 的 稳定 状态 ,所 以 方差 
反映 了 随机 变量 的 变异 特征 。 对 于 一 个 随机 变量 来 讲 ,方差 D(X) 是 一 个 稳定 常 
数 ,不 再 是 随机 的 了 。 

如 果 X 是 离散 型 随机 变量 , 且 其 概率 分 布 为 

P(X—z,)—p,(k—1, 2，…) 
那么 


DOO = Mu -EWF p, 
£i 
如 果 X 是 连续 型 随机 变量 ,其 概率 密度 为 FC ,那么 
D(X) = f Ee EOOTY fC) Dr 


在 前 面 的 例 4. 1. 13 中 ,实际 上 我 们 已 经 证 明了 一 个 很 重要 的 计算 方差 的 公式 
D(X) = E(X?) — E'(X) 
在 后 面 有 关 方差 的 计算 和 证 明 时 ,经 常 要 用 到 上 面 这 个 公式 。 
由 方差 的 定义 ,我 们 可 以 得 出 关于 方差 的 一 些 性 质 ( 假 设 下 面 所 用 到 的 方差 都 
存在 ) 。 
性 质 1 如 果 C 是 一 个 常数 , 则 
D(C)=0 
性 质 2 ”如果 C 是 一 个 常数 , 则 
DCX+C)=DCX) 
性 质 3 ”如果 a 是 一 个 常数 , 则 
D(aX) —a! D(X) 
性 质 4 设 X 和 Y 相 互 独立 , 则 
D(OXEY)—-DOO-- DO 
证 (性 质 1) 
D(CO=E[C—E(COF=E(C—C):=0 
(性 质 2) 
DCX+C)=EL(X+O)—E(X+OF=ELX—E(X)J=D(X) 
下 面 我 们 用 公式 D(X) 二 ECX?) 一 Er(X) 来 证 明 性 质 3 和 性 质 4。 
(性 质 3) 
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D(aX)=E[(aX)’]—E’(aX)=a’[E(X’)—E’(X)]=a’D(X) 
(性 质 4) 
D(OXEY) -E(CEY)! — E'(X £Y) 
—E(X* £2XY--Y*) -[E' OO £2bEOO EQ) +E Q0] 
—EGOD'—-E' OO EC) - EQ) E£2LECXCY) - EOOEQO] 
HF XAY HEM A ECXY) -EOOEECQO ,所 以 
D(XY)-EQOO! — E' OF EQ — E (Y) DOO -- DCOCY) 
一 般 情形 下 ,有 
DOXEY) - DOO DOO +2[E(XY)—E(X)E(Y)] 
性 质 4 的 结论 可 进一步 推广 如 下 (证 明 略 ) 。 
如 果 Xis Xos ees X, 相互 独立 ,ci(i 二 1,，2，,…，, nn) 是 任意 常数 ,那么 


D(Dex)= XEDA 


(2) 方 差 的 计算 
例 4.1.15 设 随机 变量 X HR SOS p 的 0-1 分布, 求 DOO, 
解 ”由 题 意 知 ,X 的 概率 分 布 为 
P(X=k)=p:(1—p)'™* (k=0, 1) 
且 E(X)=p, 又 因为 
E(X’)=0°。 (1—p)+1: * p=p 
所 以 D(X)=E(X’)—E:(X)=p—p:=p(1—p)。 
例 4.1.16 设 随 机 变量 X 服从 参数 为 的 Poisson 分 布 , 求 DOO. 
解 已 知 X 的 概率 分 布 为 


P(X =p - a> o, k—0,1,2,) 


H 已 (X) 一 人 ,又 因为 
E(X?)= aeie a-d + He 


一 M APT. cd 
m s TA 
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=X +à 
所 以 DOO SEX) -E (X)= +H SA. 
例 4.1.17 设 随机 变量 X IRA SON n. p 的 二 项 分 布 , 求 DOO, 
解 ”在 这 里 暂时 不 用 方差 的 定义 求 DCX)( 留 给 读者 自己 练习 ) ,而 从 另 一 角 
度 考虑 。 


我 们 知道 ,如 果 X 服从 二 项 分 布 , 则 X 可 以 写成 X 一 位 X ,其 中 X 相互 独 
立 , 且 P(X, = 1) = p, P(X, 一 0) 一 1 一 户 (ti 一 1， 那么 
D(X) = D(Xx)- Dax» = np (l — p) 
例 4.1.18 。 设 随机 变量 X 服从 [ae， 6] 上 的 均匀 分 布 , 求 DOO. 
解 Cu X 的 概率 密度 函数 为 


P fee arsch 
Sa 
0， Xt 


而 且 ECX) 一 43, 又 因为 





ECX2) 一 [T fdr Š f f as 
: ipa 


= Fea tab +) 


所 以 





estt sy (ahy at 
DOO — 4 G^ abb) - (557) m 


例 4.1.19 设 随机 变量 X TRA 3508 A COO DAHER R DOO, 
ARS ”由 题 意 知 ,X 的 概率 密度 函数 为 
sœ] Mas aen 
0. z0 


而 EO 一半 ,又 因为 
ECX2) 一 [eren m f ` arte dz 


eer) 2|" annis 
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所 以 


例 4.1.20 设 随机 变量 六 服从 正 态 分 布 N(p, o0 RDX). 
解 ”直接 采用 方差 的 定义 计算 D(X)。 
已 知 X 的 概率 密度 函数 为 


Ha) = Le 


7E n —o<r<+o0 
no 





H EOO =p, BEDA 





D(X)= E[X - EQOT = [ie X e dr 


2ra 








以 上 几 个 例题 中 求 到 的 一 些 常见 分 布 的 方差 都 与 它们 分 布 中 的 参数 有 关 , 一 
晶 求 出 了 期 望 和 方差 ,它们 的 分 布 也 就 唯一 确定 了 。 方 差 概率 意义 的 直观 背景 可 
以 通过 正 态 分 布 中 不 同 的 上 密度 曲线 清楚 地 显示 出 来 (图 4. 1. 2)。 





o=0.25 
----- a=0.5 


o=1 









图 4.1.2 c 越 小 取 值 越 集中 


例 4.1.21 设 /(z) 二 E(X 一 x)*, rER, 证 明 : 当 zr 一 E(X) 时 ,f(z) 达 到 最 
小 值 。 
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证 KE GO —E(OX— r) SEX) -2zEOO +r ,两 边 对 工 求 导数 有 
S/O 5, 2EQX) 

dr 
显然 当 z 一 E(X) 时 ,dc 一 0。 xn ICD — 2:0 BEBUN z— EOOM f G3 


到 最 小 值 ,最 小 值 为 
f(E(X))=E(X—E(X)):=D(X) 
这 个 例子 又 一 次 说 明了 数学 期 望 E(X) 是 随机 变量 X 取 值 的 集中 位 置 ,反映 
了 X 的 平均 值 。 
例 4.1.22 设 随 机 变量 存在 数学 期 望 ECX) 和 方差 DOO , 试 证 明 : 对 任意 的 
e>>0, 有 


PC|X 一 EQ0Izo«PCO 


证 (只 给 出 连续 型 的 证 明 ) 
D(X)= [r—ECOOF fdr 


> f Cr — EOO Y fGaodz 
RE 


| e’ f(xz)dr = è | f(x)dx 


IE LIES 
= ë P[| X- ECX) |>] 
所 以 


P(|X— EOD zo POCO 


这 是 著名 的 切 比 雪夫 (Chebyshev) 不 等 式 , 它 表明 :方差 D(X) 越 小 ,事件 
(|X 一 E(X) | 之 e) 发 生 的 概率 就 越 小 , 即 事件 (|X 一 E(X) | 一 e) 发 生 的 概率 越 大 ， 
X 的 取 值 越 集中 在 ECX) 的 附近 。 从 这 个 不 等 式 中 我 们 也 进一步 看 出 ,方差 D(X) 
刻画 了 随机 变量 X 的 分 散 程 度 ,是 反映 X 波动 状态 的 重要 指标 。 另 外 切 比 雪夫 不 
等 式 也 是 在 第 4. 3 节 中 大 数 定理 的 理论 基础 。 

切 比 雪夫 不 等 式 的 另 一 等 价 形式 是 : 


PCIX 一 ECX)1<e) 过 1 一 pan 


练习 4.1 


1. 一 箱 产品 20 件 , 其 中 5 件 优质 品 ,每 次 抽取 1 件 , 共 抽取 2 次 , 求 取 到 的 优 
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质 品 件数 X 的 数学 期 望 (分 两 种 情况 讨论 :有 放 回 地 抽取 ;不 放 回 地 抽取 )。 
2. 试 计算 上 题 中 X 的 方差 。 
3. 设 久 的 概率 分 布 为 








且 E(X)=8, 求 xz， 和 a 的 值 。 

4. 据 统计 ,一 位 60 岁 的 健康 (一 般 体检 未 发 生病 症 ) 者 ,在 5 年 之 内 仍然 活着 
和 自杀 死亡 的 概率 为 p (CO p 1, p 为 已 知 ), 在 5 年 之 内 非 自杀 死亡 的 概率 为 
1— p. 保险 公司 开办 5 年 人 寿 保险 ,条 件 是 参加 者 需 交纳 人 寿 保险 4a 元 (a 已 知 )， 
H 5 年 内 死亡 ,公司 赔偿 元 (0>a) ,应 如 何 确定 才能 使 公司 可 期 望 获 益 。 若 有 m 
人 参加 保险 ,公司 可 期 望 从 中 收益 多 少 ? 

5. 设 连续 型 随机 变量 X 的 概率 密度 为 

so- 0<r<1 
0, 其 它 

HEP k, a>0。 又 已 知 B(X) 一 0.75, 求 人 , a 的 值 。 

6. 设 连续 型 随机 变量 X 的 概率 密度 为 


zr,  O&zr«l 
jo. 1 一 z 一 2 
0, 其 它 


试 求 ECX) 和 DOO. 
7. 设 连续 型 随机 变量 X 与 Y 独立 ,其 概率 密度 分 别 为 





fito = i (r0 
x 0, z<0 
1 T 
fr(y) 一 e air， 一 co 所 < 十 co 
V2rc 


其 中 o>0。 记 Z—2X—3Y--1,uoR EC2 f D(Z)。 
8. 设 随机 变量 X 服从 参数 为 一 去 的 指数 分 布 ,随机 变量 X, 的 概率 密度 函 
数 为 


试 求 :(1)E(X1) 和 D(X1); 
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(2) 通 过 E(X1) 和 DCX,) 计 算 c< 和 下 (X:) 的 值 。 

9. 设 X~N(1, 2),Y 服从 参数 为 3 的 Poisson 分 布 , 且 六 与 Y 独立 , 求 
DXY). 

10. MRF 1620 次 , 则 “六 点 ”出 现 的 次 数 X 的 期 望 和 方差 为 多 少 ? 

11. 已 知 X~B(n, p), H EOO —3, D(X) 二 2, 试 求 X 的 全 部 可 能 取 值 ,并 
计算 P(X<8)。 

12. 对 球 的 直径 作 近 似 测量 ,其 值 均匀 分 布 在 区 间 [a, 56] 上 , 试 求 球 的 体积 的 
数学 期 望 。 

13. 设 连续 型 随机 变量 X 的 概率 密度 为 


az? +bz+c, 0<z<l 

œ=] e 

其 它 

H ECGX) —0. 5, DCOX0 —0. 15 oR Ca, b, c. 
14. Wb X 与 YY 相互 独立 ,其 概率 密度 分 别 为 

. 2z, 0<zr<l jens, y>5 

G)- w=! 
nof xe FOS o 其 它 


REXY). 
15. 设 连 续 型 随机 变量 X 在 区 间 [1, 2] 上 服从 均匀 分 布 ,随机 变量 
l, X20 
r- 0, X=0 
一 1， X<0 
RE DY). 

16. 设 某 产品 每 周 需求 量 为 Q,Q 的 可 能 取 值 为 1,2,3,4,5( 等 可 能 取 各 值 )， 
生产 每 件 产品 成 本 是 c, 一 3 元 ,每 件 产品 售 价 c: =9 元 ,没有 售 出 的 产品 以 每 件 
0 二 1 元 的 费用 存 人 仓库 。 问 生产 者 每 周 生 产 多 少 件 产品 可 使 所 期 望 的 利润 最 大 ? 

17. 在 每 次 实验 中 事件 A 发 生 的 概率 为 0.5, 利 用 切 比 雪 夫 不 等 式 估计 ,在 
1000 次 独立 重复 实验 中 ,事件 A 发 生 的 次 数 在 400 一 600 之 间 的 概率 。 

18. 电视 台 举办 智力 竞猜 ,有 两 种 类 型 的 题目 :A 类 为 历史 题 ,B 类 为 地 理 题 。 
竞猜 者 可 以 自己 选择 顺序 ,只 有 猪 对 了 第 一 题 后 猜 才 有 权 猜 第 二 题 。 猜 对 A 类 题 
得 a 分 , 猜 对 B 类 题 得 6 分 。 现 假定 某 人 猜 对 A 类 题 和 B 类 题 的 概率 分 别 为 p 和 
q*' 且 此 事件 是 独立 的 。 试 问 他 应 当先 猜 哪 类 题 , 可 使 他 的 期 望 得 分 最 高 ? 


i 
19. BA X, ~ NO, D, i= 1, 2, 3,8 X HEMA X - L ))X, Y= 


] 
DX- KREY). 
各 
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20. 一 辆 飞机 场 的 交通 车 , 送 25 名 乘客 到 9 个 站 ,假设 每 个 乘客 都 等 可 能 地 
在 任 一 车 站 下 车 ,并 且 他 们 下 车 与 否 相互 独立 。 又 知 交 通车 只 在 有 人 下 车 时 才 停 
车 。 求 该 交通 车 停车 次 数 的 数学 期 望 。 


4.2 随机 向 量 的 数字 特征 


1. 随机 向 量 的 数学 期 望 


定义 4.2.1 设 (Xi，X:，…，X,) 是 于 维 随机 向 量 , 且 每 个 随机 变量 X; 的 期 
望 E(X,) 和 方差 DOXO (i 一 1, 2, m nn) 都 存在 , 称 (ECX1),E(X;),…,E(X,)) 
为 (Xi Xas e X,) 的 期 望 向 量 (expected value vector) ,简称 期 望 (expectancy)。 
称 (DCX )，D(OX, )，…，D(OX。) HCX: ，X: t. X107; (variance). 
这 一 定义 不 过 是 一 维 情况 的 简单 推广 , 它 只 是 反映 了 随机 向 量 的 各 个 分 量 作 
- 维 随机 变量 的 取 值 情况 。 但 对 于 各 个 随机 变量 之 间 的 联系 没有 反映 出 来 ,而 
实际 中 又 是 十 分 重要 的 。 下 面 我 们 就 二 维 的 情况 重点 讨论 这 个 问题 。 


2. 协 方差 


客观 事物 是 错综复杂 的 ,但 这 种 错综复杂 并 不 是 杂乱 无 章 ,而 是 表现 为 广泛 的 
相互 联系 上 。 因 此 ,如 何 有 效 地 刻画 随机 变量 之 间 的 联系 ,对 于 我 们 研究 和 控制 随 
机 现象 是 个 重要 的 问题 。 例 如 , 某 种 商品 的 销售 量 与 价格 、 居 民 收 入 促销 手段 .市 
场 的 饱和 度 、 居 民 的 爱好 等 许多 因素 有 关 , 了 解 销售 量 与 各 因素 相关 程度 的 高 低 ， 
对 销售 商 制定 销售 策略 是 至 关 重 要 的 。 一 个 儿童 的 智商 与 营养 .教育 、 环 境 、 遗 传 
等 许多 因素 有 关 , 到 底 哪 一 个 因素 起 的 作用 大 呢 ? 掌握 这 些 情况 ,对 培养 儿童 是 很 
重要 的 。 协 方差 正 是 刻画 随机 变量 之 间 联 系 是 否 紧密 的 一 个 重要 的 数字 特征 。 

定义 4.2.2 ”对 随机 向 量 (X,Y), 若 E[(X 一 E(X))(Y 一 E(Y))] 存 在 , 则 称 
它 为 X 和 YY 的 协 方差 (covariance) , 记 为 cov(X，Y) , 即 

cov(X, Y) -E[CX -EOOX(Y - E(Y)] 
从 上 述 定义 中 可 见 , 当 X=Y, 即 它们 是 同一 个 随机 变量 时 ,有 
cov(X, Y) -E[X- EOO P  DCX) 
此 时 , 协 方差 就 成 为 该 随机 变量 的 方差 。 因 此 ,可 以 说 方差 是 协 方差 的 一 个 特例 ， 
而 协 方差 是 方差 的 推广 。 既然 方 差 反 映 了 随机 变量 本 身 的 离散 程度 ,那么 用 协 方 
差 反 映 两 个 随机 变量 之 间 的 “离散 ”程度 也 就 很 自然 了 。 
例 4.2.1 设 (X.Y) 服 从 二 维 正 态 分 布 , 其 联合 密度 为 
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1 1 (zpa)_, Grp) | (yp) 
Jundá gem a Wo "E ) 
其 中 一 co<z，y<< 十 co, 求 cov(X, Y). 

解 ”由 题 知 EX) Sy, EQ) =p, DOO —66 DOO =h, T 
cov(X, Y) 
= E[(X - E(X)XY — E(Y))] 


-Ff G — n — m) flx, y)dxdy 





foy 


z—u)y — pz) 


= 一 -一 ( 
220,0; Vl— pmo 


1 G-p? y GG p) | OT p | 
= 2p + 
exp| 20-55 ( E! 2010: Ei )]ex» 


^ ITE. SEM 





cov(X, Y) 

010: = ix 

= aij fis -exp| “a p" gis +5 dds 
2009: — xig ts exp(— iic T +A de Jas 
A 20- : 


=a es L^: esta] 

7 VE "d bord 

上 式 中 方 括号 内 的 积分 恰好 是 正 态 分 布 N Cos, 1— o ) 的 数学 期 望 ,因此 其 积分 值 
为 ps, 于 是 





cov(X, Y)— aaf". s etds 
Ja). 





x 
Se 
nas Jm d. 
= paio 
这 说 明 二 维 正 态 分 布 的 协 方差 不 仅 与 其 标准 差 mn，cz 有关, 而 且 还 与 其 第 五 


个 p 参 数 有关 。 
由 协 方差 的 定义 可 以 得 到 一 些 有 关 协 方差 的 性 质 。 
性 质 1 cov(X, Y)=E(XY)—E(X)E(Y). 
性 质 2 cov(X,Y)=cov(Y, X). 
性 质 3 cov(aX,bY)=abcov(X, Y), a,b 为 常数 。 
性 质 4 — covCXi +X, Y) —covCX; , Y) -covC Xz, Y); 
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证 这 里 只 证 性 质 1 和 性 质 4 
(性 质 1) 
cov(X, Y) — E[(X 一 ECX))(Y 一 ECY))] 

= E[XY — XECY) — YEOO + EOOE(O] 
= ECXY) — EOOEQ? 

有 了 这 个 性 质 ,随机 变量 XHY 的 方差 可 以 写成 

D(X+Y)=D(X)+D(Y)+2cov(X, Y) 
由 这 个 性 质 也 可 以 证 明 性 质 4。 
(性 质 4) 


cov(X + X; , Y)  E[(X; + X:) - Y] — E(X, + X) ECY) 
= E[XiY + X; Y] — LECX)) + ECX2) JECY) 
= EOX,Y) + ECX;Y) — E(X )E(Y) — ECX) EGO) 
= cov( X; . Y) + covC X; , Y) 


3. 相关 系数 


由 于 协 方 差 的 值 的 大 小 与 随机 变量 所 取 的 单位 有 关 , 这 对 于 评价 两 个 随机 变 
量 之 间 的 相依 关系 的 程度 大 小 有 时 候 是 不 利 的 。 为 此 ,我 们 在 协 方差 的 基础 上 进 
行 修改 ,就 得 到 一 个 与 单位 无 关 的 更 常用 的 另 一 指标 一 一 相关 系数 。 

定义 4.2.3 ”对 随机 向 量 (X, YO ,如 果 D(X) 和 D(Y) 均 存在 ,并 且 均 不 为 
零 , 则 称 

_ cov(X, Y) 
pxy — JDO VD 

为 X 与 Y 的 相关 系数 (correlation coefficient) 。 

从 上 述 定义 中 可 见 X is Y 的 相关 系数 ,事实 上 就 是 标准 化 的 随机 变量 
-EX 与 工 二 三 GO 的 协 方差 。 它 与 随机 变量 所 使 用 的 单位 无 关 ,是 一 个 规范 化 

VDX) ~ /D) 

的 指标 ,因此 在 使 用 上 上 比 协 方差 更 方便 。 

在 例 4.2.1 中 ,二 维 正 态 分 布 的 协 方差 cov CX» Y)==paos, 而 D(X)=0i， 

MP 3 — cov(X, Y) no 

DOY) =o , Bt VA — HE TE s 41 D AH E ON pxy CVDOOZ/DG? co e 
例 4.2.2 已 知 随机 变量 X 与 Y 分 别 服 从 正 态 分 布 N(1，32) 和 NC, 4). 
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Y 
试 讨论 四 若 pw 一 0, 求 (X,Y) 的 联合 密度 ; OF os 一 一 去 , Z- A RED, 
D(Z) 和 pxz o 
E OBA pw=0,X 与 了 相互 独立 ,所 以 (X, Y) 的 联合 密度 为 
fix, y= fxGo * fyCy) 
. 1 e zs 
4 Vax 
四 因为 E(X)=1,E(Y)=0,D(X)=3} DO) —4! ,于 是 
SE SY ud d. res 
ED-E($-$5)- 于 ECX) 十 去 ECY) = 地 x1 十 去 x 0-4 
PES. FE A Ime x Y 
D(z)=D( 针 + 去 )= 5 DOO 十 于 DG)  2cov( F> y) 


= 二 DCX) 十 十 DOY) 十 Low * VDX .VDCG7 





xs Lxecixcl. Fg. 





1 
9 
=3 
又 由 于 
Zi A.X a X Y 
cov(X, D= cov( X, 3 5)— cov(X, $ )+cov( X, 7.) 
zd d P 
= eov X, 20 +-beov(X, Y) 
= iDo + tor /DOO VDW) 
-dxs-ixcdox/Fxyw 
=0 
所 以 


= Oö 
re DOO VDO 
由 相关 系数 的 定义 可 以 得 出 pxy 的 有 关 性 质 。 
性 质 1 lpxy 夺 1| 
性 质 2 ”如 果 随 机 变量 Y EX 的 线性 函数 , 即 Y 二 aX 十 b(a, b 为 常数 ， 
4 天 0), 则 当 a7-0 Bf pxy — 154 a<0 BE pxy — — 1. 
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性 质 3 |pxy | 二 1 的 充 要 条 件 是 存在 常数 ab, {E PIY-aX 5 —1. 
性 质 4 若 X 与 Y 相 互 独立 , 则 pxv 一 0。 
在 证 明 性 质 1 之 前 , 须 先 证 明 一 个 重要 的 公式 一 一 柯 西 (Cauchy)- 许 瓦 兹 
(Schwarz) 不 等 式 。 即 若 随 机 向 量 (X, NWE ECX: ) 与 E(Y?) 都 存在 , 则 有 
[EXN T X ECXO EQ?) 
证 对 任意 的 实数 和 ,有 
fD - ELGX-Y)! ]- ! ECX) -2ECXY) --EQY Z0 
所 以 
ACAL[E(XY) T - AECX D ECY) to 
即 
[EXV KEX EY’) 
下 面 证 明 相关 系数 的 性 质 , 只 证 明 性 质 1 和 性 质 2, 其 它 两 个 性 质 留 给 读者 证 
明 。 
证 (性 质 1) 由 柯 西 - 许 瓦 兹 不 等 式 , 有 
[cov(X, Y)]! = [E(X — E(X) Y — EY) 
< E(X — E(X)’ - EY — EY) 
= DOODO) 
所 以 
loy | - oO l <] 
pxv —— m 
VDX) VDY) 
(性 质 2) 因 为 


cov(X, Y) — E[CX — E(X))(aX b — aECX) — 0] 
= aECX — EO)! = aD(X) 
D(Y)= D(aX +b) = a! D(X) 
所 以 
cov(X, Y) _ aD(X) |l: «470 


9" VBI VD TaD |-1. aco 
由 上 述 性 质 可 以 看 出 ,|pxr| 的 大 小 反映 了 X 与 Y 线 性 相关 程度 的 高 低 。pxy 

的 取 值 在 区 间 [ 一 1, 1) E. 根据 它 取 值 的 情况 ,我 们 有 如 下 定义 。 
定义 4.2.4 设 随机 变量 X 与 Y 的 相关 系数 为 pxy 。 若 pm 天 0, 则 称 X 与 了 
相关 (correlation); 当 o, >0 Hf fk X 与 了 IEfR3X (positive correlation) ; 当 pxy <0 
时 , 称 X 与 Y 负 相关 (negative correlation). $55? pxy —1 Ht, f& X 与 了 完全 正 
相关 (complete positive correlation); 当 px, = — 1 时 , 称 X 与 了 Y 完 全 负 相 关 
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(complete negative correlation) ; ¥ xy —0 时 , 称 X 与 了 不 相关 (noninteracting) 。 
显然 ,X 3 Y ARMDELEOXYO -ECOEQO DOXC-Y) - DOO - DOO) iy =0; 
cov(X. Y) 20; DOX--YO - D(X YO ^8 fft f 
同时 , 若 X t Y 相互 独立 ,那么 X 与 Y 一 定 不 相关 。 但 反之 不 一 定 成 立 ( 如 
前 面 的 例 4. 1. 12 可 以 说 明 这 一 点 )。 
当 (X,Y) 为 二 维 正 态 分 布 时 ,XX 与 Y 相互 独立 和 X 与 了 不 相关 是 等 价 的 。 
例 4.2.3 设 (X,Y) 在 和 矩形 区 域 D={(x, y)10 志 x 三 1, 0 过 > 一 1} 上 服从 均 
匀 分 布 , 试 判断 X 5j Y 是 否 相关 ? 
解 (方法 一 ) 
因为 (X,Y) 的 联合 密度 为 
1, 0<zr<1, 0<y<1l 
fiz, »-[ 其 它 
所 以 
ECXY) = | f ` tyf (æ, ydzrdy 


m feas ifads 





EX) = f. ey dro f [f f(z, »dy Jtr 
zx d 1 
=|=} 
同 理 EQD-l. 所 以 X 与 Y 的 协 方差 为 
covCX, Y - EY —ECX)E(Y) - 1— 1x 1-0 


BL X SY oae. 
(方法 二 ) 
因为 f(x) = 全 rz， yy = f'a = 1 zx « DIA 


l, Ozr«l 
s=] Ls 
0. Jtt 
同 理 
1, 0zyxl 
pof” "EYE 
i0. 其 它 
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于 是 对 任意 的 x,y 有 
fæ, 3) 9 fx GO fy GO 
WX 与 了 相互 独立 ,X 与 了 不 相关 。 
例 4.2.4 BCX, Y) 在 圆 形 区 域 D— (Gr. y| +y 1) ERMA 
试 判断 X 与 了 是 否 相关 ,是 否 独立 ? 
解 ” 因 为 (X,Y 了) 的 联合 密度 为 


dish n +y <1 
x.y)— 
0， RE 


所 以 
jo ph 
Ea =f' | zyf Gr» y)dzdy 





= [ef te 
=0 
EOD = BEZEL = fj s Lay 
= 2f' = Vi—zidr=0 


同 理 E(Y)==0。 所 以 X 与 Y 的 协 方差 为 
cov(X, Y)=E(XY)—E(X)E(Y)=0 


W X Y RHS. 
L vu 
因为 ico = [fos »dy- [Lay = $ AT cim. 


所 以 
2 
一 本 一 
Pen 7, (—1<r<1) 
0, 其 它 
同 理 
2 Ju s 
rof JÁi-y, (-1&ys«1) 
0, 其 它 
由 于 x. y 对 有 


fG 3) fx G2 fy Go 
BOX 53 Y Aur. 
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为 便于 以 后 应 用 ,我 们 再 给 出 随机 变量 的 “和 矩 " 的 概念 。 对 于 随机 变量 X, 若 
EC X | (8 为 正 整 数 ) 存 在 , 则 称 ECX*) 为 X H k 阶 原点 矩 , 特 别 一 阶 原 点 矩 就 是 
数学 期 望 ( 均 值 )。 称 ECCX 一 ECX))* 为 X 的 & 阶 中 心 撼 ,特别 二 阶 中 心 矩 就 是 方 
差 。 所 以 , 矩 的 概念 是 均值 和 方差 概念 的 推广 。 


练习 4.2 


1. 设 (X, Y) 的 联合 概率 分 布 为 






o 























E 
PEDES 
l|-| e fæl 
olol] 


| 


求 :(1) OX, Y) 的 期 望 与 方差 ; (2)cov(X,Y) 与 pxy 。 
(3) 问 X 与 是 否 相关 ,是 否 独立 ? 
2. 设 (X, Y) 的 联合 密度 为 
Czy, 0 和 z 和 1l, 0<y<r 
0， 其 它 
求 :(1) 常数 C; (2) CX, Y) 的 期 望 与 方差 
(3) cov(X, Y)5j pw; OC 判断 X 与 了 是 否 相关 ,是 否 独立 ? 
3. 设 D(X)=25, D(Y) —36, pxy —0. 4, R DCX--YO fü DCX 一 Y)。 
4. ta, b, c, d 为 常数 ,X 与 了 的 相关 系数 为 pxy, 试 求 Zi — aX +b, Z;— 
cY 十 d 的 相关 系数 p。 
5. it X 服从 参数 为 2 的 Poisson 44i, Y 3X — 2, R E(Y), D(Y), 
cov( X, Y) px- 
6. 设 X 服从 参数 为 1 KWER Y=X+e*, WR EY), DY), oX, YK 


flr, y= 


xy o 
7. 设 随 机 变量 X 与 Y 相互 独立 且 都 服从 正 态 分 布 N (y, oD BOR Z 一 
aX +BY, Z, —aX — BY 的 相关 系数 pzaz va:B 其 中 为 常数 。 
8. 设 随机 变量 X 5; Y 均 服 从 标准 正 态 分 布 N (0, 1), 它 们 的 相关 系数 为 


pm 一 去 , Z1 一 aX,24 一 bX 十 cY, 试 求 a,6, e fli DCZ) - DGIO 21 H Z 
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与 Z, 不 相关 。 
9. 设 随机 变量 X 与 Y 的 数学 期 望 分 别 为 一 2 和 2 ,方差 分 别 为 1 和 4, 而 相关 
系数 为 一 0. 5, 根 据 切 比 雪夫 不 等 式 估计 POXTYIZ6). 


43 大 数 定律 与 中 心 极限 定理 


1. 大 数 定律 


在 日 常生 活 中 ,评判 一 个 事物 的 好 坏 往 往 要 进行 多 次 的 观察 和 记录 ,在 条 件 允 
许 的 情况 下 ,用 多 次 结果 的 平均 作为 衡量 的 标准 ,而 且 随 着 实验 次 数 的 增加 这 种 平 
均 越 来 越 接近 于 该 事物 的 真实 状况 。 例 如 ,在 运动 会 上 体操 运动 员 某 动作 的 成 绩 ， 
是 将 各 个 评委 打 的 分 数 加 以 平均 作为 最 终 成 绩 , 而 且 参 评 的 评委 越 多 ,这 个 平均 分 
应 越 接 近 于 运动 员 的 真实 成 绩 ; 在 评估 一 个 学 校 的 某 科 成 绩 时 ,随机 选 出 50 名 学 
生 参 加 考试 ,这 50 名 学 生 的 平均 成 绩 就 作为 评估 该 校 水 平 的 标准 ,而 且 参 加 考试 
的 学 生 越 多 ,这 平均 成 绩 就 越 接 近 于 该 校 的 真实 水 平 ; 在 实验 中 要 测量 某 一 物体 的 
长 度 , 一 般 要 进行 多 次 测量 ,然后 将 多 次 测量 的 结果 加 以 平均 作为 该 物体 的 长 度 ; 
而 且 随 着 测量 次 数 的 增加 ,该 平均 值 越 来 越 接近 于 该 物体 长 度 的 真实 值 。 

以 上 事例 说 明 ,一 次 实验 的 结果 ,可 能 由 于 种 种 随机 因素 而 产生 一 些 波动 , 偏 
离 其 本 质 。 但 是 作为 大 量 实验 的 平均 结果 ,事件 发 生 的 频率 和 大 量 观测 值 的 平均 
值 都 是 有 独立 于 人 的 主观 意志 的 稳定 性 ,这 种 稳定 性 就 为 大 数 定律 提供 了 丰富 的 
生活 背景 。 

定义 4.3.1 设 随机 变量 序列 {X,) ,如果 存在 一 个 常数 a, 使 得 对 任意 的 
£0, 

limP(| X, Calce) —1 


则 称 {X,) 依 概率 收 钱 于 a。 记 作 X, a. 

依 概 率 收敛 是 概率 论 中 特有 的 一 种 思维 方式 。 随 机 变量 序列 在 无 限 通 近 数 a 
时 ,可 能 会 出 现 波动 ,有 时 波动 可 能 会 很 大 ,只 是 这 样 的 机 会 概率 越 来 越 少 。 这 种 
复杂 的 收敛 方式 在 生活 中 往往 比 微 积分 中 的 收敛 方式 要 多 。 

定理 4.3.1( 切 比 雪夫 大 数 定律 ) ” 设 随机 变量 序列 Xi, Xos …，X,,… 相 互 
独立 , 且 均 存在 数学 期 望 E(X,) 二 py, ,方差 DX, ) = <k (2 一 1，2，…) ,其 中 常 
数 k 与 无关, 则 对 任意 的 e>0, 有 


AI 3e] e]: 


证 MFX, Xes Xn AEA iA 
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由 切 比 雪夫 不 等 式 ,有 
P| Axe]: 





而 
5 





lyx-il X» |««] <1, im(1- 5 )- 1 


所 以 
imP| |lixx-ixaeQ- 1 

由 切 比 雪夫 大 数 定律 可 以 看 出 ,无 论 随机 现象 的 个 别 结果 如 何 , 大 量 相互 独 
立 随机 现象 的 平均 结果 实际 上 不 受 随机 现象 个 别 结 果 的 影响 ,平均 后 的 随机 变量 
lx 将 比较 紧密 地 聚集 在 它 的 期 望 二 > 的 附近 , 它 与 期 望 的 距离 依 概率 收 
NFP 一 co)。 

FE. EXD Sy, DCX) 二 (i 二 1,2,，…) 时 ,将 得 到 下 面 应 用 更 广泛 的 
结论 。 

定理 4.3.2 i Xis Xos …，X,，… 为 相互 独立 的 随机 变量 序列 , 且 有 相同 
的 期 望 与 方差 :EC(X, =p, DOCGO 9o! G—1. 2, …), 则 对 任意 的 es 之 0, 有 

imp[| +x -|< e]- 1 

这 一 结论 说 明 所 有 观察 结果 的 算术 平均 值 依 概率 收敛 于 期 望 值 一 一 被 观察 值 
的 真 值 。 这 就 为 我 们 实际 生活 中 用 算术 平均 值 代替 真 值 提供 了 理论 依据 。 同 时 ， 
这 一 推论 也 是 后 面 统计 中 用 样本 和 矩 去 估计 总 体 矩 的 理论 依据 。 

定理 4.3.3( 贝 努 里 大 数 定律 ) 设 每 次 实验 中 事件 A 发 生 的 概率 为 p,n 次 重 
复 独立 实验 中 事件 A 发 生 的 次 数 为 ,, 则 对 任意 的 e 二 0, 事 件 A 的 频率 各 有 

ime - oe] 1 
证 ” 设 随 机 变量 服从 0- 1 分布 , 即 


10， 在 第 i 次 试验 中 A 不 发 生 


X= 
11， 在 第 i 次 试验 中 A 发 生 
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i=1, 2, =, mn。 显然 有 
p.m Xo XibBX 一 >) Xi 
- 
X E(X)—p,DOX)0—p(0—p),i—1, 2, - n. H Xi, X2; c, X, 相互 独立 ,由 
定理 4.3.2 知 
i l = 
limP| s e|««j 1 





贝 努 里 大 数 定律 告诉 我 们 , 当 实 验 在 不 变 的 条 件 下 重复 进行 多 次 时 ,事件 A 
的 频率 依 概率 收敛 于 随机 事件 A 的 概率 户 。 这 就 为 我 们 推测 概率 值 提供 了 一 种 简 
便 易 行 的 方法 , 即 用 频率 代替 概率 。 同 时 也 使 概率 这 一 概念 的 背景 更 加 清晰 可 靠 。 

例 4.3.1 新 生 儿 的 体重 是 个 随机 变量 X。 我 们 随机 地 抽取 了 2006 年 3 月 
份 新 生 儿 ( 男 )n 名 , 测 其 体重 得 到 个 数据 ， zi，…， Zz,。 令 us GONE 
Trs s E, 中 小 于 或 等 于 工 的 个 数 ,那么 


F; co - luo 


就 代表 了 体重 X 小 于 的 频率 ,我 们 称 它 为 X 的 经 验 分 布 函数 (也 是 累计 频率 函 
数 )。 它 是 事件 (X<z) 的 频率 ,从 而 是 概率 P(X 近 zx) 的 近似 值 。 由 大 数 定律 可 

, 当 壮 越 来 越 大 时 ,对 每 一 点 ,经 验 分 布 函数 F; (z) 都 会 趋 于 随机 变量 X 的 分 
MRR F CO. BI 


limP| 
F; (z) 依 概率 收敛 于 FGo ,因此 大 数 定律 也 是 实际 应 用 中 用 经 验 分 布 代替 理 
论 分 布 的 理论 基础 。 


2. 中 心 极限 定理 


在 实际 生活 中 我 们 遇 到 的 随机 变量 大 多 数 都 服从 正 态 分 布 或 近似 正 态 分 布 。 
例如 ,上 例 中 某 地 区 2006 年 3 月 份 新 生 儿 的 身高 和 体重 服从 正 态 分 布 ;工厂 中 产 
品 某 性 能 的 指标 一 般 也 服从 正 态 分 布 , 因 此 生产 过 程 中 的 质量 控制 图 就 是 以 正 态 
曲线 为 基础 绘制 的 :在 对 经 济 问题 (如 商品 价格 、 商 品 销售 量 ) 进 行 定 量 分 析 时 , 往 
往 在 找 出 主要 的 因素 之 外 ,其 它 各 种 因素 的 综合 影响 就 用 一 个 服从 正 态 分 布 的 随 
机 变量 来 表示 等 等 。 这 些 随机 变量 有 一 个 共同 的 特点 :由 若干 相互 独立 的 随机 变 
量 的 和 构成 。 事 实 上 ,如 果 一 个 随机 现象 由 众多 的 随机 因素 所 引起 ,每 一 因素 在 总 
的 变化 里 作用 不 显著 。 可 以 推断 ,不 管 每 一 微小 因素 原来 服从 什么 分 布 ,描述 这 个 
随机 现象 的 随机 变量 都 近似 地 服从 正 态 分 布 。 





& -px«n|[«ej- 1 
n 
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3E38 4.3.4 独立 同 分 布 中 心 极限 定理 (independent identically distribution 
central limit theorem) 设 随 机 变量 序列 X ，X;: ，…，X,,，… 相 互 独立 同 分 布 , 而 且 
E(OX) —u, DOC) 9 G1, 2, =), 0770, BU B LAE fit 


XXn 
yağ 
vno 
的 分 布 函数 Fy, (z) 对 任意 工 有 
limFy, = limP 25 £2 900 
cl vac vna 








这 个 定理 表明 只 要 ”比较 大 ,随机 变量 Y, 就 近似 地 服从 标准 正 态 分 布 。 因 而 
23 X, 近似 地 服从 正 态 分 布 NCw ，xo?)。 中 心 极限 定理 确立 了 正太 分布 在 各 种 分 


布 中 的 首要 地 位 , 它 也 是 数理 统计 中 大 样本 处 理 方法 必 不 可 少 的 理论 基础 。 

若 记 8 二 (zx), 则 由 中 心 极限 定理 给 出 的 近似 公式 PCY a) 2G) — g [JH 
来 解决 三 类 计算 问题 :(1) 已 知 wz 求 B;(2) 已 知 z,B 求 zi (OBA pRa. 

例 4.3.2 一 生产 线 生 产 的 产品 成 箱包 装 , 每 箱 的 重量 是 随机 的 。 假 设 每 箱 
平均 重 50 千克 ,标准 差 为 5 千克 。 若 用 最 大 载重 量 为 5 吨 的 汽车 承运 ,试用 中 心 
极限 定理 说 明 每 车 最 多 可 以 装 多 少 箱 ,才能 保障 不 超载 的 概率 大 于 0. 977, 

解 ” 设 XI(G 一 1,，2,，…，' mn) 为 装运 的 第 i 箱 的 重量 (单位 :千克 ),n 是 所 求 的 
箱 数 。 由 题 意 可 把 X ，X: ，…，X, 看 作 独 立 同 分 布 的 随机 变量 , 令 

Y,=X, +X: +e X,- ÈX, 

那么 Y, REX n 箱 货物 的 总 重量 。 又 知 EX )=50, DX) —5!  E(Y,0 — 

50m,D(Y,) 王 25Vi。 由 中 心 极限 定理 有 


5000— 50n 


sj Je. err- ec 
7 


PY. «5000 -o( 


所 以 
TE > 198. 0199 
最 多 可 以 装 98 箱 。 
例 4.3.3 t Xi, Xi. e, 处 ，… 是 独立 同 分 布 的 随机 变量 序列 ,其 中 
X,^NCO, D G=1, 2,…) ,那么 令 


3X -n» 
Y, = 二 一 一 一 
2n 
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Ju Y, 渐 近 服从 标准 正 态 分 布 。 
证 显然 依 题 知 
E(X?)= D(X) -E (X) 一 1 
D(X} = EOG) — EXXD 
2 Jg fae-i-s-i-iGoi 2,9) 


所 以 


由 中 心 极限 定理 有 








WI Y, 渐 近 服从 标准 正 态 分 布 。 
在 数理 统计 中 ,随机 变量 > X? 的 分 布 是 一 个 重要 的 分 布 (x? -分 布 )。 上 例 告 


诉 我 们 , 当 -> oo 时 , DO X? 渐 近 服从 正 态 分 布 NGn, 2n), 
下 面 再 介绍 一 个 定理 , 它 实际 上 也 是 定理 4. 3.4 的 一 个 自然 推论 。 
定理 4.3.5 设 随机 变量 y(n 二 1,2,…) 服 从 Bn, jp) , 则 对 任意 zx, 有 


im (让 < I)= $G) 
因为 二 项 分 布 为 离散 型 分 布 ,而 正 态 分布 为 连续 型 分 布 ,所 以 用 正 态 分 布 作为 二 项 
分 布 的 近似 计算 中 , 作 些 修正 可 以 提高 精度 , 若 a 过 5, 均 为 整数 ,一 般 先 作 如 下 修 
正 后 再 用 正 态 近似 








Pla f) 7 Pla —0. scp <00. Dp TEE) E) 
HE HH JA ME o 

这 个 定理 说 明 . 当 ”~== 时 ,二 项 分 布 的 极限 分 布 为 正 态 分 布 。 它 给 出 了 二 项 
分 布 的 一 种 近似 计算 方法 。 我 们 知道 ,在 n 次 重复 独立 实验 中 ,事件 A 出 现 的 次 
K u, 是 服从 二 项 分 布 的 ,因此 当 较 大 时 ,关于 us 的 计算 均 可 用 正 态 分 布 去 近 
似 。 


E 中 心 极限 定理 演示 实验 
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在 这 里 我 们 也 可 以 看 出 ,大 数 定律 定性 地 指出 了 许多 独立 的 随机 因素 蚕 加 的 
平均 结果 收敛 于 常数 而 趋 于 稳定 。 而 中 心 极限 定理 则 定量 地 给 出 了 这 个 琶 加 结果 
的 极限 分 布 。 从 而 使 对 随机 现象 的 研究 更 加 具体 全面 ,更 有 操作 性 。 

例 4.3.4 设 电路 供电 网 中 有 10000 3& 4T «D Ie 6 — sie T JF 3 B EE M E 
0.7, 假 定 各 灯 开 、 关 时 间 彼 此 无 关 , 计 算 同 时 开 着 的 灯 数 大 于 6800 且 小 于 7200 的 
概率 。 

解 ” 设 XX 表示 同时 开 着 的 灯 数 , 则 依 题 知 X~B(10000, 0. 7)。 显 然 
E(X) —np—7000, DOX) — Vnp(1 一 p)==45.83。 因 此 由 定理 4.3.5 有 


ae) el) 


= G6(4.36) — P(— 4. 36) 
= 24(4.36) 一 1 
= 0. 99999 
例 4.3.5 设 有 40 个 电子 元 件 Di ，D:，…，D ,它们 的 使 用 情况 如 下 :D， 
损坏 ,D* 立即 使 用 ; D; 损坏 ,Di 立即 使 用 ;……。 设 每 个 电子 元 件 D, 的 寿命 X， 
是 相互 独立 同 分 布 的 随机 变量 ,E(X,)= 二 10, D(X,)=10, 邻 XX 表示 40 个 电子 元 
件 使 用 的 总 寿命 , 求 P(420 一 X 一 460) 。 








PC6800 < X < 7200) &( 





‘0 
R SAX— >)X, 由 于 XI，X:，…，X 独立 同 分 布 ,所 以 


E(X) = >)E(Xi) —400, D(X) = DD(X,) = 400 
ez e 
由 定理 4. 3.4 知 


P(420 < X < 460)~ 6( 生 元 4) 一 o( 和 元 各) 


20 20 
一 @(3) 一 @(1) = 0. 9986 — 0. 8413 
— 0.1573 


例 4.3.6 ”分 别 利用 切 比 雪夫 不 等 式 及 中 心 极限 定理 估计 概率 P( [=p|>:), 
其 中 心 是 次 贝 努 里 试验 中 事件 A 发 生 的 次 数 ,p 为 事件 A 在 每 次 试验 中 发 生 
的 概率 ,并 就 n=600, p 一 言 , e 一 0.02 时 进行 比较 。 


解 ” 和 由 于 pm~Bln, p) E(&)=p, (£e) - 0—P munem 
式 有 


100 Mg SPSS 应 用 











0 eue 
由 中 心 极限 定理 有 
p(|e- o |o) 1- n(|- |) 








—1—Pí(n(p—o «p, «nipteol 


~i- fo mam el aa) 











i-e sugli tag 
-[:- C1] 
4 n=600, p=4, 一 0. 02 时 ,由 切 比 雪夫 不 等 式 有 
p(|&- |») ao = 0. 5787 
由 中 心 极限 定理 得 
ne 


p. 二 PON € ——— 
p(s »|>.)~2 *( ERE 
可 见 , 由 中 心 极限 定理 计算 的 结果 要 比 用 切 比 雪夫 不 等 式 精确 得 多 。 


)]= 0. 1886 





练习 4.3 


1. 一 个 螺丝 钉 重量 是 一 个 随机 变量 ,期望 值 是 1 两 ,标准 差 是 0. 1 两 , 求 一 盒 


(100 个 ) 同 型 号 螺丝 钉 的 重量 超过 10. 2 斤 的 概率 。 


2. 对 敌人 的 防御 地 段 进 行 100 次 友 炸 ,每 次 友 炸 命中 目标 的 炸弹 数目 是 一 个 
随机 变量 ,其 期 望 值 为 2, 方 差 为 1.69, 求 100 DOR KE pfi 180 颗 到 220 颗 炸 弹 命 


中 目标 的 概率 。 


3. 在 进行 加 法 运算 时 ,为 简便 起 见 , 每 个 加 法 取 整 数 ( 按 四 舍 五 人 取 最 为 接近 
的 整数 )。 可 以 认为 各 个 加 数 的 取 整 误差 是 相互 独立 的 ,并 且 它 们 都 服从 


[一 0.5,0. 5] 上 的 均匀 分 布 。 求 
(1) 将 300 个 数 相 加 ,误差 总 和 的 绝对 值 超过 15 的 概率 ; 


(2) 最 多 几 个 数 加 在 一 起 ,其 误差 总 和 的 绝对 值 小 于 10 的 概率 不 小 于 9026; 


(3) 如 果 有 300 个 数 相 加 ,以 99.7%% 的 概率 断定 其 误差 总 和 所 在 的 范围 。 


4. BA 30 个 电子 器 件 , 它 们 的 使 用 寿命 T，T,,…， Ta 都 服从 4 二 0.1 ( 单 
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位 :( 小 时 )-') 的 指数 分 布 。 其 使 用 情况 是 第 一 个 损坏 ,第 二 个 立即 使 用 ;第 二 个 损 
坏 ,第 三 个 立即 使 用 ;……, 令 了 为 30 个 器 件 使 用 的 总 计时 间 ,计算 了 超过 360 小 
时 的 概率 。 

5. 某 微机 系统 有 120 个 终端 ,每 个 终端 有 5% 的 时 间 在 使 用 。 若 各 终端 使 用 
与 否 是 相互 独立 的 , 试 求 有 不 少 于 10 个 终端 在 使 用 的 概率 。 

6. 设 在 nn 次 贝 努 里 试验 中 ,每 次 实验 事件 A 出 现 的 概率 均 为 0.7, 要 使 事件 
A 出 现 的 频率 在 0. 68 到 0. 72 之 间 的 概率 不 少 于 0. 90, 问 至 少 要 进行 多 少 次 试 
验 ? 

(1) 用 切 比 雪夫 不 等 式 估计 ; (2) 用 中 心 极限 定理 计算 。 

7. 一 保险 公司 有 10000 人 投保 ,每 人 每 年 付 12 元 保险 费 。 已 知 一 年 内 投保 
人 死亡 率 为 0. 006, 如 死亡 ,公司 付 给 死者 家 属 1000 元 。 求 

(1) 保 险 公司 年 利润 为 0 的 概率 ; 

(2) 保 险 公司 年 利润 不 少 于 60000 元 的 概率 。 

8. 某 车 间 同型 号 机 床 有 200 部 ,每 部 机 床 开动 的 概率 为 0.7。 假 定 各 机 床 开 
动 与 否 互 不 影响 ,开动 时 每 部 机 床 需 耗 电 能 15 个 单位 。 问 至 少 供应 多 少 单位 电能 
才能 以 95%% 的 概率 保证 不 致 因 供电 不 足 而 影响 生产 。 

9. 抽样 检查 产品 质量 时 ,如 果 发 现 有 多 于 10 个 的 次 品 , 则 拒绝 接受 这 批 产 
品 。 设 某 批 产品 的 次 品 率 为 10%, 间 至 少 应 抽取 多 少 个 产品 检查 ,才能 保证 拒绝 
接受 该 产品 的 概率 达到 0. 97 f 
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前 四 章 内 容 已 经 告诉 我 们 ,随机 现象 可 以 用 随机 变量 描述 ,而 对 随机 变量 的 刻 
画 最 好 是 知道 它 的 分 布 函数 ,或 至 少 知道 它 的 某 些 数字 特征 . 问题 在 于 , 当 我 们 刚 
接触 某 一 具体 的 随机 现象 时 ,描述 这 种 随机 现象 的 随机 变量 的 分 布 函数 及 其 数字 
特征 一 般 来 说 都 是 未 知 的 ,因此 ,研究 这 一 随机 现象 ,首先 必须 解决 的 问题 是 如 何 
确定 相应 的 随机 变量 分 布 函 数 或 它 的 某 些 数字 特征 ? 比如 ,如 何 确定 某 地 区 人 均 
年 消费 额 的 分 布 ? 如 何 确定 某 企 业 生 产 的 一 批 电子 组 件 平均 使 用 寿命 ? 普查 或 逐 
一 地 试验 固然 是 获得 此 类 问题 最 准确 结果 的 方法 ,但 实施 这 种 方法 ,必然 耗费 大 量 
的 人 力 、 财 力 ,更 何况 有 些 试 验 或 费时 (如 对 城市 居民 市 场 购买 力 的 调查 ) 或 难以 办 
到 (如 电子 组 件 的 使 用 寿命 .轮胎 的 行使 里 程 等 都 是 破坏 性 的 试验 以 及 因 居 住 、 危 
险 而 难以 接触 人 群 的 调查 ), 因 此 ,这 种 方法 在 实际 中 不 可 行 。 在 长 期 的 实践 研究 
中 ,人 们 总 结 出 一 种 实用 而 合理 的 方法 随机 抽样 法 , 即 从 所 研究 的 对 象 中 任 
意 抽取 一 小 部 分 进行 试验 或 观察 ,并 对 所 得 资料 ( 带 有 随机 误差 ) 加 以 整理 和 分 析 ， 
依据 这 些 资 料 显示 的 统计 规律 性 ,应 用 概率 论 原理 ,对 所 研究 对 象 整体 的 统计 规律 
性 作出 推断 。 简 言 之 ,由 部 分 推断 整体 ,这 就 是 数理 统计 的 研究 方法 ,其 方法 的 科 
学 体系 构成 是 以 概率 论 为 基础 的 重要 应 用 性 学 科 数理 统计 学 。 随 着 计算 机 
科学 技术 的 迅速 普及 ,数理 统计 学 在 经 济 、 管 理 . 教 育 ` 医 学 .国防 .体育 .工业 、 农 
业 ,社会 等 众多 学 科研 究 领域 中 已 得 到 了 广泛 应 用 。 


5.1 数理 统计 学 中 的 基本 概念 


1. 基本 概念 
为 研究 方便 , 先 作 一 些 规定 。 


(1) 总 体 和 个 体 

我 们 把 研究 对 象 的 全 体 称 为 总 体 (population) ,把 构成 总 体 的 每 一 个 对 象 称 为 
个 体 (individual) 。 比 如 ,要 研究 某 一 批 电子 组 件 的 使 用 寿命 , 记 寿 命 为 和, 它 是 一 
个 随机 变量 ,X 的 全 部 取 值 的 集合 即 为 总 体 , 而 X 的 每 一 个 可 能 取 值 即 为 个 体 。 
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(2) 样 本 和 简单 随机 抽样 

我 们 从 总 体 XX 中 随机 地 抽取 个 个 体 ,并 用 X. Xer onm X, 表示 ,这 个 个 
体 称 为 取 自 总 体 X 的 样本 (sample) ,样本 中 个 体 的 数目 称 为 样本 容量 (size of a 
sample) 。 从 总 体 中 随机 抽取 样本 的 过 程 称 为 抽样 (sampling) ,满足 下 面 两 个 要 求 
的 抽样 称 为 简单 随机 抽样 (simple random sampling) 。 一 是 样本 具有 代表 性 :总 体 
中 每 个 个 体 被 抽 到 的 机 会 均等 , 个 体 的 分 布 能 代表 总 体 的 分 布 , 即 X, 与 X 同 分 
布 ;二 是 样本 具有 独立 性 :总 体 中 每 抽出 一 个 个 体 后 ,总 体 的 元 素 个 数 “ 几 乎 " 没 变 ， 
这 只 要 要 求 样本 仅 占 总 体 的 很 小 部 分 ,从 而 保证 了 Xis Xes ees Xn 的 相互 独立 
性 . 由 简单 随机 抽样 得 到 的 样本 称 为 简单 随机 样本 (simple random sampling) ,以 
后 如 无 特别 说 明 ,所 谈 样本 均 指 简单 随机 样本 。 样 本 在 抽样 前 (做 一 般 性 研究 ) 为 
n 个 随机 变量 ,在 抽样 后 (做 具体 性 研究 ) 为 个 样本 值 s res t x, 。 


(3) 统 计量 和 抽样 分 布 

为 了 集中 样本 所 带 来 的 总 体 的 信息 ,我 们 经 常会 根据 问题 的 需要 ,构造 有 关 样 
本 的 函数 ,以 便利 用 这 些 函数 对 总 体 的 分 布 或 数字 特征 作出 推断 。 我 们 把 不 含 任 
何 未 知 参数 的 样本 的 函数 称 为 统计 量 (statistic) ,统计 量 本 身 是 一 个 随机 变量 , 且 
可 由 样本 值 计 算出 来 . 统计 量 的 分 布 称 为 抽样 分 布 (sample distribution). 常用 的 
统计 量 如 下 。 


FUR E BEIGE A, — L3 Xr 一 1， 2，…) ,特别 样本 一 阶 原点 类 A 称 为 
样本 均值 (sample mean) , 记 为 X. 
样本 阶 中 心 条 :B, 二 LY OG - X» G — 1.2. 70 ,特别 "修正 样本 二 阶 中 


bli" — D (C X 称 为 样本 方差 (sample variance] , 记 为 5 ,其 算术 平方 要 
S 称 为 样本 标准 差 。 
BERADA -O 一 YX —aX* 是 常用 的 简 算 公式 。 
BISLA WX Xe X, 为 取 自 某 总 体 X 的 样本 , 则 -| (X, 一 X): 是 
2 


Q c». 
(A) 样 本 二 阶 原点 矩 〈B) 样 本 二 阶 中 心 矩 
(C) 统 计量 CD) 样本 标准 差 

解 ”按照 定义 ,应 选 C。 
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2. 正 态 总 体 下 的 常用 统计 量 及 其 分 布 


WR X—NG. P), Xi, Xas s X, 为 取 自 该 总 体 X 的 样本 。 


(1) 四 大 分 布 及 其 分 位 数 
QD 标准 正 态 分 布 NO. 1) 及 其 上 侧 分 位 数 。 当 ,of 均 已 知 时 ,统计 量 Z= 
X-u Nc. D. Xll 0a POL Z)) =a, WES Z, 为 N(0, 1) 的 上 侧 a 分 


Vn 
位 数 。 易 见 ,@(Z.) 王 1 一 a。 
x 分布 及 其 上 侧 分 位 数 , 当 y= 二 0, 6 — 1I ei REY! — YIXOh BE 


Je n 1 y^ Seit SERO 4 4 FOR FL EJE n 0 y! 4f ia y! G0 E y" 分 布 
RAIE BAS X — x Go. Y — x G0. X, Y flr M] XHY — y! Qn mx T0— 
a< Me PO! > G0) — a WEE yz G0 28 A RE n 9 x? 分 布 的 上 侧 a 分 位 数 。 


BL 分 布 演示 实验 


例 5.1.2 iE Xi, X Xi. X, 是 取 自 总 体 X 一 N(0，4) 的 样本 , 若 
a(X, 2X2! (3X, —AXO* 服从 x? (2) WR a= ,b= 


R 因为 X 一 2X; — NC, 20), 3X; —4X, — NC, 100), 所 以 AX 一 2X:) 一 





fO o OX — AX! — y CO ,于 是 按照 规定 ， ago 2X9 ^ LGX- AX) ~ 


3 P 1 
(2), 通 过 比较 , 易 得 ad 4 一 100。 


四 ,分 布 及 其 上 侧 分 位 数 。 设 X~ NO. D, Y~), X, Y 相互 独立 , 则 
称 7 一 -全 所 服从 的 分 布 为 自由 度 是 ” 的 4 分布 , 记 作 4()。 
4 
不 同 于 g^ OD ff) it Beo £e t EXER se Go f S Ir M P BP N(0，1) 的 密度 


MER SOSHPRE E SE BRL FE nh Hm BOXE G0 8TD)H NC. 1) 替 代 。 
XF 021.6 PCT G0) Sa, WEK t. (DH (G0 RI EE a 分 位 数 。 


B + 分布 演示 实验 
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例 5.1.3 DA cG0 EE E fl a 4 (EXC UI 
P(T<t, (n))= , P(T<— 1 (n))= ; POTIGGD- 





R ”依次 应 填 1 一 a ,a, 2a。 
© 下 分 布 及 其 上 侧 分 位 数 。 设 X~ n), Y~ n), X, Y 相互 独立 , 则 
Xx 
称 下 = 他 所 服从 的 分 布 为 自由 度 是 Cm， m fF 2f ie fe FCn, n0. XR 


n? 


FFn, m), XF Oma POSF, Qn « m)) =a ER F, Gn no) 为 Fm «n2 





的 上 侧 a 分 位 数 。 由 1 一 “= POE Fn mn))=P( 寺 < 一 )= 
F ~F(n, m) 

1- PLUS g pel Ll -a, x loros m) 
F^ Fi.(m, m) F^ Fi. (m. m) ” F ee 


1 u z 1 
[cM np E m. m) BPH Fi- ns) 二 二 二 一 一 ~ 


E 分 布 演示 实验 


(2) 抽样 分 布 基本 定理 
设 总 体 X 一 NG 60. Xi Xas t X, 为 取 自 该 总 体 的 样本 , 则 有 以 下 结论 


à E 
Wu X-Nq. D; o CPE pin; O x 5s 相互 独立 。 


了 
Bl 样本 均值 分 布 演示 实验 和 样本 均值 与 样本 方差 独立 性 演示 实验 


由 此 得 下 面 重 要 结论 : 
Vn Ea) 
又 设 Xis Xeon X, 为 取 自 总 体 X — NGa oi) 的 样本 ,Yi Yun Y, È 
取 自 总 体 Y 一 N(jpz， 怠 ) 的 样本 , 且 两 组 样本 相互 独立 , 则 可 证 明 : 
X—-Y-GQi —5) Noo, D 


I 
gi qo 
n nz 


106 概率 统计 与 SPSS 应 用 











E ~ Fia, —1. n; —1) 
图 
Moi =o} itia sc DS 0s DSE ani, 
— ~tm n —2) 
Srt n 


例 5.1.4 设 总 体 X 一 N(0, 1), Xi Xon. X, 是 取 自 该 总 体 的 样本 , 则 
下 列 各 式 正确 的 是 ( ) 


(CA) X~N(0,1) (D 5X — NC. 1) 
X T vs $ 
(C) Fla) (D) Ex -— XO) 
解 应 选 D。 
3. SPSS 实现 


(1) 利用 SPSS 计算 样本 均值 样本 方差 .样本 标准 差 
例 5.1.5 随机 抽取 13 位 同学 的 微 积分 .英语 .计算 机 课程 成 绩 ( 见 表 5. 1. 1 
中 SPSS 数据 文件 例 5. 1. 5) , 试 计算 其 每 门 课 的 样本 均值 .样本 方差 .样本 标准 差 。 
解 ”首先 在 SPSS 变量 编辑 窗口 定义 变量 :为 微 积 分 成 绩 ,y 为 英语 成 绩 ,< 
为 计算 机 成 绩 ,在 数据 编辑 窗口 输入 数据 ,得 到 如 表 5. 1. 1 所 示 数 据 文件 。 
表 5.1.1 随机 抽取 的 13 位 同学 的 三 门 课程 成 绩 
































Untitled 
File Edit View Iransfora Analyze SPSSAddins € 
mide S - | |t A Tir E 
12 
x |y | 
1 80 66 7 
2 90 78 78 
3| 98 88 86 
4| 78 78 68 
5| 78 78 69 
5| 67 79 96 
7 78 98 93 
8| 86 87 69 
引 76 87 87 
10] 66 86 7 
11 89 85 68 
12] 88 67 87 
13| 78 76 89 
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然后 依次 选项 : Analyze Descriptive Statistics 一 Descriptives, 即 如 图 5. 1. 1 显 


LT 





b 
y Conpare Means P Explore 
GB. General Linear Model b Crosstabs. 
7g Mized Models b Ratio. 
88 Correlate » 
78 Regression 上 


图 5.1.1 


在 打开 的 对 话 框 中 将 源 变量 栏 ( 左 侧 ) 的 x，>，=z 选 入 分 析 变 量 栏 
Options. . . 按钮 ,在 弹出 的 子 对 话 框 中 选择 相应 的 选项 (如 图 5. 1. 2) 。 















I Bange 
Distribution 
f^ Kurtosis 






Display Order 
@ Variable ist 


点 击 Continue-* OK, BFAA h ROK 5. 1. 2) 。 
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表 5.1.2 Descriptive Statistics 














N Mean Std. Deviation Variance 
微 积分 成 绩 13 80.92 9.087 82.577 
英语 成 绩 13 81.00 8. 794 77.333 
计算 机 成 绩 13 80. 31 9. 961 99. 231 
Valid N (listwise) 13 





由 此 表 易 见 ,13 个 学 生 的 微 积分 平均 成 绩 为 80. 92, 标 准 差 为 9. 087, 方 差 为 
82.577, 13 个 学 生 英语 平均 成 绩 81. 00, 标 准 差 8. 794 ,方差 77. 333,13 个 学 生 的 
计算 机 平均 成 绩 为 80. 31, 标 准 差 9. 961 ,方差 99. 231 。 


(2) 利用 SPSS 计算 四 大 分 布 的 分 位 数 

@ 计算 标准 正 态 分 布 的 上 侧 a 分 位 数 。 因 为 C2) —1— a. HI CDFNORM 
Cz) =1— a, E SPSS 数据 编辑 窗口 (需要 随便 打开 一 个 数据 文件 ), 依 次 点 击 
Tansform—>Compute 得 到 一 个 对 话 框 ,在 Targat Variable HR Ej A, z, 在 右 侧 Func- 
tions: 中 选 IDF. NORMAL (p, mean, stddev) 并 点 击 向 上 的 箭头 使 该 函数 放 和 人 
Numeric Expression: rp ,在 三 个 问号 处 填 人 (1 一 ay0,1) ,点击 OK 便 得 到 标准 正 
态 分 布 ( 对 给 定 的 a) 的 上 侧 a 分 位 数 z, 二 IDF. NORMAL, 如 : 
zo.0s =IDF. NORMAL(0. 95, 0, 1) —1.64 
wo.02 7 IDF. NORMAL(. 975, 0, 1) —1. 96 
25,55 7 IDF. NORMAL(O. 025, 0, 1) —— 1. 96 
OHR y! GO RE EM 分 位 数 。 设 X y! Can), W POX 2) — IDF. CHISQ 
nn) ,而 对 给 定 的 a, 上 侧 a 4) fr Y? G0 — IDF. CHISQCG —a, 7 (ll: 
iss (0 —IDF. CHISQ(0. 05, 12) —5. 23 
Xi.os (n) —IDF. CHISQ(0. 95, 12) —21.03, 
图 计算 (G0 EU 分 位 数 。 设 X~), W POX — DF. TG n), ffi 
对 给 定 的 a, 上 侧 a 分 位 数 1,(n) 二 IDF. TOA —a, n), 4: 

to.os (n) =IDF. T(0. 95, 16) —1. 7459 

to.os (n) 7 IDF. T(0. 05, 16) — —1. 7459 

图 计算 FOn , 0 08 EW 分 位 数 。 设 X 一 F(m nn), 则 PCX) —IDF. FG, 
m, n RAEM a EU a 分 位 数 F.(m ,mm) 王 IDF.F(I 一 c, m, n lli 

Fo.io On m)=IDF. F(0. 90, 12, 13) —2. 10 

Foss (m » m) —IDF. FC0. 05, 12, 13) —0. 38 


Gr 
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BL 四 大 分 布丁 数值 演示 实验 
例 5.1.6 在 总 体 X~N(12, 4) 中 抽取 样本 容量 为 5 的 样本 X. X Xss 


Xo X , 求 下 列 概率 :DO PCILX —12] £D: © PGnaxCX;, i, X;)>15); 
G PGninCX, ，…，Xs) 二 10) 











解 ”Q@ 因为 X~N(12， dai —N(O, 1) ,于 是 
* 
X—12 i 
P(QX-12]1c2D- P 4 IUE 
5 


24(1.118) — 1 = 2CDFNORM(1.118) — 1 
= 2 X 0.8682 — 1 = 0. 7364 
Q) P(naxCX, , *, X:27215) 2 1— PGnax(X, *, Xs)<15) 
= 1—P((X, <15, X; &15, =, X; <15) 
—1—P(O IS) PCX; 15) - P(X; 15) 
—1-[PC(OX8)  -1- [$0.55 
—1—[CDFNORM(I. 5) 
—1— (0. 93319)* —1—0. 7077 —0. 2923 
© PGninCX, , =, X710) — PCXG 10) PCX?7210) - PCX,2710) 
=[P(X>10)] 2[1— PCOX& 10 ]* 
-[1—4(- DT 
—[40)]* - [LCDFNORM(C) J 
— (0, 8413)* —0. 4215 
$15.1.7 — WE Xi, Xo ons XS ERA GE X 一 N(C3，100) 的 样本 , 求 概率 
P(0<X<6, 57. 1S! «151. 734) 
解 ”由 抽样 分 布 基本 定理 可 得 
P(0« X «6, 57.7 < S? < 151.73) = P(0 < X < 6)P(57.7 < $ < 151. 73) 


= P(—1.5< ms < 1.5) P(13. 848 < zs < 36.4152) 


一 EA 5) — IJ[CDF. CHISQ(36. 4152, 24) 一 
CDF. CHISQ(13. 848, 24) ] 
= [2 x 0. 9332 — 1][0. 9500 — 0. 0500] = 0. 7798 
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练习 5.1 


_/lzxl, lzl<1 
Los lzl31 

求 (1) 样 本 均值 的 数学 期 望 和 方差 ;(2) 样 本 方差 的 数学 期 望 ;(3) 样 本 均值 的 绝对 
值 大 于 0. 02 的 概率 。 

2. 设 总 体 X 一 Nes o. 假如 要 以 0. 9606 的 概率 保证 偏差 |X 一 | «0. 1. 
ju]; 4 o= 0.25 时 , 样本 容量 应 到 多 大 ? 

3. 从 一 个 正 态 总 体 X~ NG o) 中 抽取 容量 为 10 的 样本 , 且 PCIX — >D 
三 0.02, 求 :o。 

4. 设 在 总 体 关 一 N(x, ) 中 抽取 一 个 容量 为 16 的 样本 ,po 均 未 知 , 求 


p(x. 861). 


1. WE X~ fon Xis Xas tee Xs 为 取 自 该 总 体 的 样本 ， 


5. 设 总 体 X— NGe« 16) Xi. Xo Xi 为 取 自 该 总 体 的 样本 ,已 知 PCS >a) 
二 0.1, 求 :常数 a。 
6. 设 总 体 XX 一 NG 60.Xi Xo n. X, 为 取 自 该 总 体 的 样本 , 求 ;(1) P(X 一 j)* 


«Ty 0) 当 样本 容量 很 大 时 ,PLX 一 p)* 过 23);(3) 当 样本 容量 等 于 6 时 ， 





PUR- <5), 


7. WE Xis Xas s Xo HWA UE X — NO. 0.09) 的 样本 , 求 : PO X > 


1.44). 
8. W Xi Xos es X, 是 取 自 总 体 X ~ NGe 00 的 样本 ,X 为 样本 均值 ,又 记 











" iow £o gn lw *$ gol NA i 8 
si = T -32:05—0 ¿$= TILA ‚$= 
LDX, 2. 则 服从 分 布 vn 一 1) 的 随机 变量 T 一 
1 
Qo e a» X4 c X a» X—- 
Vn—1 Vn—1l vn—lY n—l 


9. 2; T—1GD W T? 服从 什么 分 布 ? 
10. 设 Xi, X2, es Xs 为 取 自 总 体 X 一 N(0, 4) 的 样本 , 求 常数 a, 5,c 使 得 
Q—a(X, c X, HDX: +X, +X: Y  eCOX Xi X X0* BU y! 分布, 并 求 
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其 自由 度 。 
11. HER k PESE X — N u. 00 ,从 第 i 个 总 体 中 抽取 容量 为 n; 的 样本 


Xas Xass Xa LH ELO ILU HE ur ie X, = PR imd Ades 


=m +m +e tna RW — iàNÀ. -XP 的 分 布 。 


12. 设 随机 变量 X， 了 相互 独立 目 帮 服从 标准 正 术 分布 ， Ti Xis Xon Xs。 和 
Yis Yas ees Yo 分 别 是 取 自 总 体 X, Y 的 相互 独立 的 简单 随机 样本 , 求 统 计量 Z 一 


= 的 分 布 ,并 指明 参数 。 





，X, 是 取 自 正 态 总 体 X ~ Nu, 00 的 样本 , H Y, = 


TOU HX bee XY, = LOG XE XOSSt 一 iic — YO sk: 
e 

















z=- ZA uq, 
14. 设 总 体 X ~ Niu, 于 ), 从 中 取出 样本 Xis Xos ee Xos Xi, 记 X, 一 
lu DN: so ; MEL T n Xe—X. ooi 
` DX S; = 772X% XO ORE] T S tn—1)。 
15. 设 总 体 X — NO, 4), m x. Xas eee Xi 为 取 自 该 总 体 的 样本 , 则 随机 
PE | XXE 
变量 Y = IK FKF - 分 布 ,参数 为 s 
16. 设 总 体 X 一 NO, 1) ,XI，X。，…,X, 为 取 自 该 总 体 的 样本 , 求 :V = 
Dx 
S um D a> 5) 的 分 布 。 


Èx 
5.2 期 望 与 方差 的 点 估计 


1. 参数 估计 的 基本 思想 


正如 前 面 所 说 .数理 统计 的 基本 任务 是 依据 取 自 总 体 的 样本 对 总 体 进行 推断 。 
实际 中 , 有 时 知道 了 总 体 的 分 布 类 型 分布 便 由 几 个 与 总 体 有 关 的 未 知 的 数字 所 
决定 。 要 掌握 总 体 的 分 布 . 依据 样本 对 这 些 未 知 参数 做 尽 可 能 准确 的 推断 就 显得 
非常 重要 。 
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我 们 把 未 知 的 数字 叫做 未 知 参数 (unknown parameter), 对 其 进行 推断 有 两 个 
问题 需要 解决 : 一 是 求 其 近似 值 , 称 其 为 未 知 参数 的 点 估计 值 ( 量 ) (point esti- 
mate); 二 是 求 其 近似 范围 , 称 之 为 未 知 参 数 的 区 间 估 计 (interval estimate) 。 

根据 待 估 未 知 参数 的 统计 意义 ,由 样本 构造 恰当 的 统计 量 , 利用 样本 值 计算 
统计 量 的 值 , 此 统计 量 的 值 称 为 待 估 未 知 参数 的 估计 值 ， 因 该 估计 值 表现 为 实 轴 
上 的 一 个 点 〈 数 ), 故我 们 称 这 种 方法 为 参数 的 点 估计 法 ， 有 时 并 不 要 求 对 未 知 参 
数 做 定 值 估计 ， 而 要 求 估计 出 未 知 参数 的 一 个 所 在 范围 , 并 指出 该 范围 包含 未 知 
参数 的 概率 , 该 范围 表现 为 实 轴 上 的 一 个 区 间 ， 所 以 这 种 方法 称 为 区 间 估 计 法 。 
最 常见 的 未 知 参数 是 总 体 的 期 望 和 方差 , 本 节 介 绍 其 点 估计 法 。 


2. 点 估计 的 评选 标准 


设 待 估 未 知 参 数 为 0, 其 点 估计 为 gb= OX ，X:，…，X,)。 易 见 ， 抽 样 前 0 一 
了 (Xi，X2，…，X, ) 为 随机 变量 (估计 量 ), 抽样 后 为 一 个 实数 (估计 值 ), 对 不 同 
的 样本 值 , 9 的 估计 值 9 二 f(X,，X;，…，X,) 也 不 同 。 我 们 自然 希望 估计 值 0 一 
/(X1，X:，…，X,) 尽 可 能 准确 地 表达 未 知 参数 0 的 真 值 , 这 就 产生 了 对 估计 值 
Gi. 的 评选 问题 。 评 选 估计 量 Â= AX, ，X: ，…，X, ) 的 标准 一 般 有 以 下 三 个 方面 。 

(1) 无 偏 性 (unbiasedness) 

不 同 的 样本 值 可 得 不 同 的 估计 值 , 随 着 抽样 的 不 同 , 估计 值 也 不 同 ， 由 样本 
所 得 的 估计 值 可 以 不 等 于 未 知 参 数 的 真 值 , 但 它们 应 在 真 值 附近 ,有 时 小 ， 有 时 
相等 , 有 时 大 , 很 自然 应 当 要 求 它们 的 平均 值 恰好 等 于 真 值 , 即 E(9)==0。 车 0 的 
点 估计 8 满足 这 一 要 求 , 我 们 便 称 9 为 9 的 一 个 无 偏 估计 ( 量 ) (unbiased esti- 
mate) ， 即 用 8 做 9 的 近似 值 没有 系统 偏差 。 


B 无 偏 性 演示 实验 


例 5.2.1 dX; Xe, cns X, JH HX. 的 样本 , 总 体 期 望 ECX) 一 /未 
Hl, ais azs tt an 为 常数 , H a +a: +- +a, = 1, RHE: aX; 为 E(X) 一 
ii 
4 的 一 个 无 偏 估 计 。 


证 BAE aX) = DaE(X) — (DadE(X) = p 
A A £ 


mA DaX HECO = 10 —4 X AMAT. 
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特别 , 取 a 一 as 二 … 一 ao 一 士 ,可知 样 本 均值 为 总 体 均值 的 一 个 无 信 
估计 。 
从 本 例 易 知 两 点 : 一 是 /的 无 偏 估计 不 唯一 ,因为 al ， ase ns a, 的 选择 方法 
有 许多 种 ; 二 是 当 总 体 方差 DOO = o! 存在 时 ,在 ai ais nns a, 的 所 有 选择 中 ， 
样本 均值 的 方差 最 小 , 即 DO < DO aX) 此 因 
1= (a d à; + +a) — ai +e +a + 2a14; +e + 2a1a, d- 2aras 十 … 十 2 an 
X aj d t Ha + Cal dr al) Hb Gala Ha?) 
= nla} 4- +a?) 
从 而 可 得 : aittai St, 
例 5.2.2” 设 总 体 X 的 期 望 为 4， HZH Xi, Xo e X, 为 取 自 总 体 X 
的 样本 , 则 样本 方差 S 为 的 一 个 无 偏 估计 ， 而 样本 二 阶 中 心 矩 B, 不 是 的 
无 偏 估计 。 
证 因为 D- =Y- 
利用 公式 EOCO - DOO-FCEOOD! 可 得 


EÒ (X, — 3?) 2 MEO) —nE(X’) 
如 ft 


= Be t) E eun = (n— De! 
MCECS —o^, MERNÉ S 为 o! 的 一 个 无 偏 估计 。 
而 EB) = uit Q1. BEDAREE T Bb B. 不 是 or 的 无 偏 估计 。 


无 偏 性 是 点 估计 的 基本 要 求 , 它 保证 9 对 9 的 估计 只 有 随机 误差 , 而 没有 系统 

(2) 有 效 性 (effectiveness) 

因为 9 的 无 偏 估计 是 不 唯一 的 , 那么 自然 就 产生 一 个 问题 ， 就 是 在 0 的 所 有 
无 偏 估 计 中 哪 一 个 更 “好 ”一 点 呢 ? 必须 明白 的 是 , 这 里 * 好 ”的 意思 是 : 8 的 取 值 更 
靠近 0 或 更 集中 在 0 的 附近 。 由 此 一 个 自然 的 评选 标准 就 是 方差 。 

BÔ 与 名 均 为 9 的 无 偏 估计 , EDO SDO , WE Â, Hô 更 有 效 。 进 一 
Jp. 如 果 固 定 样本 容量 n, 在 9 的 一 切 无 偏 估 计量 中 , 9 的 方差 达到 最 小 , 则 称 À 
为 9 的 有 效 估 计量 (efficient estimator). 易 见 ,Xi 5j X Ej EX) = p 的 无 偏 估 
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2 
i. 但 DCX,)=D(X)=0， DOO —7- CH n>1 时, X EX, 有 效 。 


9ISL3 HEX. Xe X, 是 取 自 总 体 X 的 样本 ， 取 统 计量 二 aX, 
作为 ECX) = jp 的 估计 , HEF ai Har +e Ha, = 1, RÆK a, ars o an 使 得 


h= YlaX 最 有 效 。 


解 TES. 2. HEIE, = JaiX, SECO 一 /的 无 偏 估计 ， 并 且 DGO 
= (al ad d n Fa DOO «SER at +a +o cal Ell a 十 as 十 … 十 an = 
1 的 条 件 下 达到 最 小 值 , 利用 拉 格 朗 日 乘 数 法 ,容易 求 得 w = a 二 … 二 a, = l. 
即 样本 均值 X A R3 US) MEE ua 的 这 种 形式 的 估计 量 中 最 有 效 的 估计 量 。 

:实际 应 用 中 , 常用 Rao- Cramer 不 等 式 来 证 明 8 是 有 效 估计 量 . 可 以 证 明 ， 
无 偏 估计 量 8 的 方差 D CD 永远 不 会 小 于 正 数 D, (OD . Bl 

1 
一 一 一 一 一 一 >0 
nE[xjnfCX. o] 
上 式 称 为 Rao - Cramer 不 等 式 。D。(0) 称 为 方差 的 下 界 , 当 DO) = D.C 时 ,9 即 
为 0 的 有 效 估计 量 。 

例 5.2.4 BÖR X ~ PA), Xis Xos ns X, 为 取 自 该 总 体 的 样本 , 试 证 : 
À = X 为 的 有 效 估计 量 。 

证 首先 E() = EOD — à. HÀ — X Ja 的 无 偏 估计 量 , 又 因 DÂ) = 





DÔ) > D,(0) = 


D(X) = FEL D= Ee InfGr, à) —— à + zlii 一 In(Czl)， 所 以 就 有 

£s 2 1 xd d cua m 

E[ sr »] = E[sex-2» ]- JDO) = 元， 故 由 Rao- Cramer 不 等 式 

知 D,(0) = -= =DÅ)=DX)= i. 即 为 — X 为 的 有 效 估 
nE[ f(x | 

计量 。 


(3) 相合 性 (consistency) 

无 论 是 无 偏 的 或 有 效 的 估计 量 9, 对 给 定 的 样本 容量 n, 一 般 都 不 会 有 8 — 0。 
但 是 当 n 无 限 增 大 时 六 可 以 无 限 趋 于 90。 即 对 任意 给 定 的 正 数 s， 总 有 limP(C10 一 0| 一 
€) = 1, RlimP 9 一 9 |> 0 一 0 这 自然 应 该 成 为 评选 估计 量 0 的 第 三 个 标准 。 
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我 们 称 满足 此 条 件 的 8 为 的 相合 估计 ( 量 )。 由 切 比 雪夫 不 等 式 易 见 ， 当 
limE | ĝ—0 | 二 0 对 某 r > 0 成 立时 , 9 为 0 的 相合 估计 ( 量 )(consistent 


estimator) 。 


E 相合 性 演示 实验 


例 5.2.5 Wb Xi. Xs. X, 为 取 自 总 体 X 的 样本 , EX) =p, DOO— 
o, JU FEAS HI X Je 43548 E OO =y 的 相合 估计 量 。 
证 ”利用 切 比 地 雪夫 不 等 式 得 
P(|X—pl>0 < 


DOO s 
€ en 
所 以 limP(|X—pl>e)=0 
故 样本 均值 xX 是 总 体 均 值 E(X) =p 的 相合 估计 量 。 
在 现代 统计 学 的 研究 中 , 均 方 误差 
E(O 一 0): = DG) 十 LE(D) — 0]? 
是 评选 估计 量 8 的 最 常用 也 是 最 全 面 的 标准 。 由 此 , 近 几 十 年 来 ， 提 出 了 许多 有 
用 的 并 已 付 诸 实施 的 均 方 误差 小 的 有 偏 估计 ,如 岭 估计 .、 主 成 分 估计 、 根 方 估计 、 
偏 最 小 二 乘 估计 等 等 ,可 以 说 这 些 研究 确实 成 为 统计 学 研究 领域 一 道 亮丽 的 风景 
线 。 


3. 数学 期 望 和 方差 的 点 估计 


数学 期 望 和 方差 是 总 体 X 的 两 个 最 重要 的 数字 特征 。 数 学 期 望 表 示 X 取 值 
的 平均 水 平 ， 方 差 表 示 X 取 值 相对 于 平均 水 平 的 偏离 程度 。 因 此 , 利用 取 自 总 体 
X 的 样本 Xi，X:，…，X, 的 均值 X 作为 总 体 数学 期 望 的 估计 量 , 用 样本 方差 
S 作为 总 体 方差 o 的 估计 量 是 很 自然 的 。 利 用 估计 量 的 评选 标准 也 充分 证 明了 
这 样 做 的 合理 性 。 下面 我 们 再 将 这 种 方法 规范 出 来 。 

例 5.2.6 设 总 体 X~U(Ca, b), Xis Xas s X, 为 取 自 该 总 体 的 样本 , R 
a, b 的 估计 量 。 


解 ” 因 为 E(X £22, Doo-r2*, 
^ EOO-X. D(X)=S’, 
可 得 方程 组 ab y, Se 
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解 之 得 a—X—J/8S. b— X--/8S 即 为 所 求 。 
练习 5.2 


1. 设 总 体 X~U O, 20), Hp 00 是 未 知 参 数 ， 又 Xi ，X: ，…，X, 为 取 自 
该 总 体 的 样本 ，X 为 样本 均值 . 证 明 : à-2x 是 参数 0 的 无 偏 估计 。 


2. 设 0 是 参数 0 的 无 偏 估计 量 ，D(b) 二 0, 证 明 : 信 RE 的 无 偏 估计 量 。 

3. 设 X, Xos X, 是 取 自 总 体 X 的 样本 , 试 证 下 列 统计 量 都 是 总 体 均 值 wx 的 
无 偏 估计 量 , 并 指出 哪 一 个 最 有 效 ? 

Dasg X; Dasi XH+, 


(3) aix HiX, 


4. 设 总 体 X 一 U(0,，9)， 现 从 该 总 体 中 抽取 容量 为 10 的 样本 ,样本 值 为 : 
0.5. 1.3, 0.6, 1.7, 2.2, 1.2, 0.8, 1.5, 2.0, 1.6 
试 对 参数 0 进行 点 估计 。 
5. 从 一 批 电 子 元 件 中 抽取 8 个 进行 寿命 测试 , 得 到 如 下 数据 (单位 : 小 时 ): 
1050, 1100, 1130, 1040, 1250, 1300, 1200, 1080 
试 对 这 批 元 件 的 平均 寿命 以 及 寿命 分 布 的 标准 差 进行 点 估计 。 

6. 从 均值 为 1, 方差 为 e 的 正 态 总 体 中 分 别 抽 取 容 量 为 n, A n 的 两 组 独立 
样本 XX, Xe 分 别 为 两 组 样本 的 样本 均值 。 试 证 : 对 任何 常数 a, bl(a 十 b 二 1)， 
Y=aX, +0X: 都 是 wz 的 无 偏 估 计 ， 并 确定 a, b 的 值 使 Y==aX 十 bX 在 此 形式 的 
估计 量 中 最 有 效 。 


5.3 ” 期望. 方差 的 区 间 估 计 及 SPSS 实现 


如 前 所 述 , 点 估计 是 用 一 个 点 ( 即 一 个 实数 ) 去 估计 未 知 参数 , 通俗 地 讲 ， 就 
是 找到 了 未 知 参数 的 一 个 近似 值 。 顾 名 思 义 ,区 间 估 计 就 是 用 一 个 区 间 去 估计 未 
知 参数 。 即 在 实际 问题 中 , 通常 需要 知道 未 知 参数 的 一 个 近似 范围 。 比 如 ,估计 
一 个 人 的 年 龄 在 20 一 25 岁 之 间 , 估计 某 人 某 一 次 旅游 所 需 费 用 在 1000 — 1500 元 
之 间 , 等 等 。 区 间 估 计 是 一 种 很 常用 的 估计 形式 , 其 好 处 是 把 可 能 的 误差 用 醒目 
的 形式 标 出 来 了 。 你 估计 旅游 费用 需 1000 元 , 我 相信 和 多 少 会 有 误差 ,误差 多 少 ? 
单 从 你 提出 的 1000 这 个 数字 还 给 不 出 什么 信息 。 你 若 估 计 旅 游 费用 在 800— 
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1200 元 之 间 , 则 人 们 会 相信 你 在 作出 估计 时 , 已 把 可 能 出 现 的 误差 考虑 到 了 , 多 
少 给 人 们 以 更 大 的 信任 感 。 

用 数学 语言 来 表述 ,所 谓 区 间 估 计 ， 即 依据 取 自 总 体 的 样本 Xi. Xon 
X,， 找 两 个 统计 量 0 ， 2, 使 得 PC, 一 0 一 六 ) —1—a. 其 中 0a. 这 时 , 区 间 
(0, ,0. ) 称 为 未 知 参 数 0 的 置信 区 间 (confidence interval). 0, 称 为 置信 下 限 (lower 
confidence limit), 0. 称 为 置信 上 限 (upper confidence limit). 1 — a 称 为 置信 度 
(degree of confidence) 或 置信 水 平 (confidence level) 或 置信 系数 (confidence coeffi- 
cient). JI, a HKE CÓ, ,如 ) 不 含 0 的 概率 ， 即 对 未 知 参 数 估 计 失 准 的 概率 。 


a 置信 区 间 几 何 解 释 演示 实验 


容易 明白 ,a 越 小 , 即 1 一 a 越 大 , 说明 区 间 (9 ,六 ) 的 可 靠 性 越 好 , 另 一 方面 ， 
区 间 长 度 久 一 0 越 小 , 说 明 区 间 (0, OL ) 的 精确 性 越 高 。 比 如 , 估计 一 个 人 的 年 龄 
在 某 一 区 间 内 , 如 (30,35) 内 , 我 们 要 求 估 计 尽 量 可 靠 , 即 该 人 的 年 龄 有 很 大 把 
握 在 这 个 区 间 内 。 同 时 也 要 求 区 间 不 能 太 长 ， 比 如 ,估计 一 人 的 年 龄 在 区 间 
(10,90) 内 ,当然 可 靠 了 , 但 精确 性 太 差 , 用 处 不 大 。 但 是 , 可 靠 性 、 精 确 性 这 两 
个 要 求 是 相互 矛盾 的 。 区 间 估 计 理 论 和 方法 的 基本 问题 , 就 是 在 已 有 的 样本 资源 
的 限制 下 , 怎样 找 出 更 好 的 估计 方法 , 以 尽量 提高 可 靠 性 和 精确 性 , 但 终归 有 一 
定 的 限度 。 波 兰 背 美国 统计 学 家 ]， 奈 曼 在 20 世纪 30 年 代 提 出 并 为 现代 所 广泛 
接受 的 原则 是 : 先 保证 可 靠 度 , 在 保证 足够 可 靠 性 的 基础 上 尽量 提高 精确 性 。 





BL 区 间 估 计 性 质 演示 实验 


Tz] - 奈 曼 的 这 个 原则 ， 就 是 在 保证 给 定 的 置信 系数 1 一 之 下 , 去 寻找 有 优 
良 精度 的 区 间 估 计 ， 而 这 个 “优良 ”也 可 以 有 种 种 原则 ,目前 已 有 一 些 结果 ， 鉴 
于 本 书 范围 , 我 们 所 能 做 的 , 就 是 从 直观 出 发 ,如何 去 构造 看 来 是 合理 的 区 间 估 
计 。 


1. 单 正 态 总 体 数学 期 望 的 区 间 估计 


设 总 体 X~N(j, è), Xis Xos ee X, 为 取 自 该 总 体 的 样本 。 


(1) & BA, y 待 估 
由 于 要 推断 总 体 数学 期 望 w, 自然 想到 了 它 的 无 偏 估计 样本 均值 X. 依 抽样 
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分 布 基本 定理 , X~ NG 2 )， 标 准 化 后 可 得 : 


Z=— X= Ee~ No, D 
FE: 
注意 到 2 有 以 下 三 个 特点 : 一 是 样本 的 函数 ; 二 是 含 且 仅 含 待 估 未 知 参数 wi 
三 是 其 分 布 与 待 估 未 知 参 数 无关。 为 方便 计 ， 有 人 喜欢 称 具有 这 三 个 特点 的 变 
量 为 “ 枢 轴 变量 ”, 它 一 般 是 从 待 估 未 知 参 数 的 一 个 良好 的 点 估计 出 发 来 构造 的 。 
对 给 定 的 <， 即 置信 和 度 1 一 a, 因为 PUZ <z) =la, 解 不 等 式 |Z| <z, 


Wd X- tet a. 这 这 说 明 在 置信 度 1 一 下 , 得 到 未 知 参数 y 的 置信 


F 
区 间 为 
(X— Lr, X (5.3.1) 
dn vn ^ 


(2) 未知, 4 待 估 
WT o^ RA, 所 以 此 时 Z 不 能 再 用 , 实际 中 , 一 个 自然 的 想法 是 用 的 无 偏 
估计 样本 方差 S! 替代 之 ,这 时 便 得 到 
T= ŽA m2 inl 
E 3 
n vn 
这 样 得 到 的 随机 变量 工 也 恰好 具有 与 Z 类 似 的 三 个 特点 , 也 为 “ 枢 轴 变量 ”, 于 是 
对 给 定 的 a, 由 于 POLT t (一 1)) 二 1 一 a, RERIT] t (n 一 1), 可 得 
Rm Dep X aa Qi D. 于 是 ， 当 总 体 方差 o 未 知 的 情况 下 总 体 
n n 


期 望 w( 未 知 参数 ) 的 置信 度 为 1 一 a 的 置信 区 间 为 
x. zS 
X— 4: (a—1)), X 244( 1) 5.3.2 
( qiio qiio (5.3.2) 
下 面 我 们 介绍 利用 Excel 求 置信 区 间 的 方法 。Excel 求 置信 区 间 使 用 
CONFIDENCE 函 数 , 其 语法 格式 如 下 


CONFIDENCE(a.c, n) = (5. 3. 3) 
2i 


置信 下 限 为 : 
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X — CONFIDENCE(a;c. n) (5.3. 45 
置信 上 限 为 : 
X+CONFIDENCE(a,0, n) (5.3.5) 
例 5.3.1 设 正 态 总 体 的 方差 为 1, 根据 取 自 该 总 体 的 容量 为 100 的 样本 计 
算得 到 样本 均值 为 5, 求 总 体 均值 的 置信 度 为 0. 95 的 置信 区 间 。 
解 ” 由 题 设 条 件 知 ,应 选用 公式 
于 
(X "d 4 Itip 
X o=l,n=100, x—5, a=0. 05, zoo —IDF. NORMAL(0. 975, 0, 1)=1. 96. 


BIB. 一 者 X1 96—0. 196, 工 一 0. 196 一 4. 804, z 十 0. 196—5. 196. 从 而 所 求 
n 


置信 区 间 为 (4. 804. 5. 196). 

例 5.3.2 某 种 零件 的 重量 服从 正 态 分 布 . 现 从 中 抽取 容量 为 16 的 样本 ,其 
观测 到 的 重量 (单位 ; 千克 ) 分 别 为 4.8，4,.7，5.0，5. 2，4.7，4. 9，5. 0，5. 0， 

6,4.7, 5.0, 5.1, 4.7, 4.5, 4.9, 4.9。 需 要 估计 零件 平均 重量 , 求 平均 重量 

的 区 间 估计 , 置信 系数 是 0.95. 

解 ”零件 的 平均 重量 的 点 估计 是 义 , 因 零 件 重量 的 方差 未 知 , 我 们 必须 用 式 
(5. 3.2) 来 求 总 体 均值 的 区 间 估 计 。 

下 面 我 们 介绍 应 用 SPSS 求 置信 区 间 的 方法 。 首 先 ,建立 数据 文件 ( 表 5. 3. 1. 
见 SPSS 数据 文件 例 5. 3. 2) 

表 5.3.1 随机 抽取 的 16 个 零件 的 重量 
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依次 点 击 Analyze Compare Means—One-Sample Test… ,如 图 -5. 3. 1 所 示 。 
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图 5.3.2 


点 击 OK, 即 得 到 输出 结果 ( 见 表 5.3.2 和 表 5. 3. 3) 。 
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表 5.3.2 One-Sample Statistics 





N Mean Std. Deviation Std. Error Mean 














X 16 4.856 .1931 .0483 





表 5.3.3 One-Sample Test 





Test Value — 0 





95% Confidence Interval 
Sig. Mean 


t df of the Difference 
(2-tailed) Difference 























Lower Upper 
X 100. 590 15 . 000 4.856 4.753 4.959 








从 表 5. 3. 3 可 见 HU ERE SEG RIO 0. 95 的 区 间 估 计 为 (4. 753,4. 959)。 
2. 单 正 态 总 体 方差 的 区 间 估计 

(1) 总 体 均值 /已 知 

这 时 总 体 方差 d WERA LOG R, a 


Q 是 “ 枢 轴 变 量 "。 对 给 定 的 os 由 于 POT << QD —1—«. 所 以 ， 解 不 
等 式 Xi_4 (wD) 二 Q 二 将 (nm), 可 得 or 的 园 信 度 为 1 一 a 的 置信 区 间 是 


E-o Ea =p? 

(2) 总 体 均值 未 知 

这 时 总 体 方差 的 无 偏 估计 为 样本 方差 S， 且 Q= DS 
全 类 似 于 上 段 可 得 o? 的 置信 度 为 1 一 a 的 置信 区 间 是 


(5.3.6) 


~x -D,.5É 


(n— DS  (q—DS' 
Gia-Dp' dpa D) (5.3.7) 
m 
(Xi — XY (X, —X»* 
ži 2 (5.3. 7^) 


aI ' yal) 
例 5.3.3 ”投资 的 回收 利用 率 常常 用 来 衡量 投资 的 风险 . 随机 地 调查 了 26 
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个 年 回收 利润 率 (%), 标准 差 5 二 15(%)。 设 回收 利润 率 为 正 态 分 布 , 求 它 的 方 


差 的 区 间 估 计 ( 置 信 系 数 为 0. 95)。 
解 ” 依 题 意 应 用 公式 (5. 3.7) 来 求解 ,公式 为 
(n= (n—l)S: 
(Aa D ee) 
HX n—1-—25, $ — 15! —225, a=0. 05, 利 用 SPSS 计算 分 位 数 好 os (25) = 
40. 65, 35.5 (25) —13.12, 


(n—DS* _ 25X225 _ (n—DS* _ 25X225 _ 
Aa- 40.65 936 x 10 D- dg&i2 一 人 8 735， 


所 以 方差 的 置信 区 间 为 :(138. 376, 428. 735), 
3. 两 个 正 态 总 体 均值 差 的 区 间 估 计 


设 样本 Xi Xos ees X, 取 自 总 体 X N Ga s oi), PEA Yis Yos es Yn B 
总 体 Y~ NGs » i), HARRERA, X St. Y, SE 分 别 表示 两 组 样本 的 均 
值 和 方差 。 

(1) 35 oi f ci HBAR, is 一 /的 区 间 估计 

由 于 ~ Nn £5, FNU £, H X, Y HH. 所 以 对 ~ 了 一 





N(a —j 
RN Lew s FERAI 
z=% Y- -e | No, 1) 
CERE 
mom 


易 见 , 此 变量 为 “ 枢 轴 变量 ”, 对 给 定 的 概率 a, 由 POZ <z) —1—a. 解 不 等 式 
12Z1<z4 ,可 得 pw 一 pe 的 置信 度 为 1 一 a 的 置信 区 间 是 


X-Y-zg [££ x-vyoa [& - &y (5.3.8) 
m n r m 7i; 
思考 : 如 一 pa 的 置信 度 为 1 一 a 的 置信 区 间 呢 ? 
(2) H oi oi HRA, (B o=o 时 , pu 一 pw 的 区 间 估 计 


DE oi 
我 们 记 g= TPE e DS wu S; 为 a ts xdi, H 


To EF (un 1 — o, en, 一 2), 这 个 变量 显然 也 是 一 个 " 枢 轴 变 量 "利用 


€ 
1 1 
Sra n 
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E. 并 与 前 一 段 类 似 的 做 法 可 得 pn — s 的 置信 度 为 1 一 a 的 置信 区 间 是 


X — Y—s, | 3 Lau (n m — 2, X E S, | - - Lt Qi 4m —2) 
n, m * m mn 


(5.3. 90 


(3) 24 oi M o 均 未 知 , 18 m; — m —7, ju 一 jx 的 区 间 估 计 

此 时 , 邻 Z; — X, —Y;. W Zi— NGna — pe v ito), E Zi Zo t Z, 视 为 取 
自 总 体 Z— N Ga 一 pe oi Fo FRAIS «— 由 单 正 态 总 体 当 方 差 未 知 时 总 体 均 值 的 区 
间 估 计 方 法 可 得 ju 一 pw 的 置信 度 为 1 一 a 的 置信 区 间 是 


FS S: 
(Z— %4: (n—1), Z+% (n—1)) (5.3.10) 
CUm £ qt 
Ki z-X-Y, $= à PE, 


(4) 34 oi 3B oi 均 未 知 ,但 n,n 均 很 大 (一 般 加 ,ns 均 大 于 50), pu 一 jw 的， 
区 间 估 计 
这 是 所 谓 的 大 样本 情形 , 可 用 


(X-Y-2 C8, X-Y+a |245 (ssi 
n; n n; 


作为 一 pz 的 置信 度 为 1 一 x 的 近似 置信 区 间 。 


(5) 34 oi 3Ra o? HRA, pu 一 pz 的 区 间 估计 

在 这 种 情况 下 , R 一 pz 的 区 间 估 计 是 统计 学 中 的 一 个 著名 的 问题 , 叫做 贝 
伦 斯 - 费 希 尔 问 题 。 这 个 问题 经 过 许多 著名 的 统计 学 家 研究 过 , 得 不 出 简单 确切 
的 解法 , 但 提出 了 一 些 近 似 解法 (所 谓 “ 近 似 解 法 ”， 其 含义 就 是 所 求 出 的 区 间 估 
计 的 置信 系数 不 一 E A 1 一 a, 而 只 是 近似 地 等 于 它 )。 下 面 我 们 
仅 介 绍 这 些 解法 中 的 一 

JUGE IURE Si. St RAHASI oi. oh 而 得 到 二 


ddwy SES, peg r-X-Y— 2, gp, pii, 
该 变量 已 不 再 服从 c 4p US UIDI DE HE 的 + 分布.(k) 很 接近 。 由 公 
x 


k= (5.3.12) 


Si Si 


Gu — D * Gu — Dai 


决定 (一 般 不 为 整数 , 可 以 取 与 它 最 接近 的 整数 代替 之 ), 近似 地 取 T~e) ， 
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应 用 与 情况 (2) 类 似 的 步骤 , 得 到 ju 一 ys 的 区 间 估 计 为 
X—Y— it; k), X — Y rs Q0) (5.3.13) 
置信 系数 近似 地 等 于 1 一 “。 

例 5.3.4 某 工厂 利用 两 条 自动 化 流水 线 听 装 番茄 着 ,分别 从 两 条 流水 线 上 
抽取 随机 样本 : Xis Xas 0s XM Yi, Yos es Ys 计算 出 X—10.602, Y= 
9.5( 克 )，Si 一 2.4，S; 一 4.7。 假 设 这 两 条 流水 线 上 听 装 番茄 酱 的 重量 都 服从 正 态 
分 布 , 其 总 体 均值 分 别 为 wm，m , 且 有 相同 的 总 体 方差 。 试 求 总 体 均 值 差 六 一 
的 区 间 估 计 ， 置 信 系数 为 0. 95。 

解 ” 依 题 意 ,利用 公式 (5. 3.9) 求 解 。 


(X-Y-s, [lel Gm —2. X -Y-- S, /T+ i (n 十 加 一 2)) 
n, n ne 


因为 =12, ns 二 17, a—0.05, Si 二 2.4, S$—4.7, 2—10.6, y 二 9.5, 又 计算 ; 


gi (m DSit(m— DS:_11X2.4+16X4.7_ 
n tnm-—2 27 


t Oi, Hm — 2) — 1,55 (27) —2. 05 


-y5 1341, —2)—10.6—9.5— ll 
X—-Y—-S, aso ait (nm 72) 710, 6—9.5— 1,940 X A 15-15 X2. 05 


— —0. 3995 


X—Y-s, |] -4- La m +m —2)—10.6—9.54-1.940x , [L4 T x 2, 9$ 
» d 1217 


—2.5995 
所 以 ,总 体 均 值 差 pu 一 yx; 的 区 间 估 计 为 ( 一 0. 3995 , 2.5995 ) 。 


4. 两 正 态 总 体 方差 比 的 区 间 估 计 


3.7630, S,=1. 940 





~ im — 1), 


由 于 Sis SEAMH oi, ot AR ES oc pog PS 


Ile 
wD os). 且 二 者 相互 独立 , 所 以 
1 


Si/si 
Silo 
易 见 ,此 变量 为 “ 枢 轴 变 量 ”。 对 给 定 的 c, 因为 

PCs; 1, D « F « Fin —1, m —1) —1—a 
解 不 等 式 , 并 注意 到 Fin l, ns 一 1 二 [Fs (ns 一 1, m- D] 8E S 47726 
H i/o; 的 置信 和 度 为 1 一 a 的 置信 区 间 是 


F= ~ Fi —1.n —1) 
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Fp 1, DT S Feu - tm 70 SD 5.3. 14) 
或 
(Fis (m — l, m DS. Fyon lsm DS (5.3. 14^) 
或 
(Fs Gi; — 1, 5 — 0] S, pr, 1o 1, — D]? 95 (3 14^ 
Si * Si 


思考 ; i/i 的 置信 度 为 1 一 a 的 置信 区 间 ? 

例 5.3.5 为 了 比较 用 两 种 不 同方 法 生产 的 某 种 产品 的 寿命 而 进行 一 项 试 
验 。 试 验 中 抽 选 了 由 方法 一 生产 的 16 个 产品 组 成 一 随机 样本 ,其 方差 为 1200 小 
时 ; 又 抽 选 了 由 方法 二 生产 的 21 个 产品 组 成 另 一 随机 样本 , 得 出 的 方差 为 800 小 
时 。 试 以 95% 的 可 靠 性 估计 两 总 体 方差 之 比 的 置信 区 间 。 

解 。 设 方法 一 生产 的 产品 的 寿命 为 X 一 N(um ,of), 方法 二 生产 的 产品 的 寿 
fir Y—NGa » oi). MERR ot /ot 的 置信 度 为 95%% 的 置信 区 间 。 

由 题 意 我 们 利用 公式 (5. 3. 14 ) 来 求解 。 

C(CF-g(m l, m —D Š, Fş(m— l1, m—1) ñ, 
因为 Sf 二 1200,S3 二 800, a 二 0.05, m —16, n =21, 又 易 计 算 

Fs a; —1, n, - D — Fas (20, 15)=2. 76 

F,- £O; — 1m — D — Foss (20,15) —0. 39 


Si 1200 
Fi-s Qj —1, m—Dsg-o. 39X goo 一 0.58 
Si 1200 _ 
FiO—-l,m 一 D 吕 一 2.76X-800 一 4 14 


所 以 ,两 总 体 方差 之 比 oi /o BO REGERE. 95 6 09 RE fX I] C 0.58, 4. 14 ) 。 

由 上 述 方法 求 得 的 总 体 均 值 差 或 总 体 方差 比 的 置信 区 间 , 我 们 在 实际 中 通常 
有 下 列 结 论 : 

CD 车 jn 一 pw 的 置信 区 间 的 下 限 大 于 零 , 则 可 认为 >s 车 pu 一 pz 的 置信 
区 间 的 上 限 小 于 零 ， 则 可 认为 qe pes ge — e 的 置信 区 间 包 含 零 , 则 可 认为 
ncs 

© 35 ai /oi 的 置信 区 间 的 下 限 大 于 1. 则 可 认为 of 二 6; H oi/a 的 置信 区 间 
的 上 限 小 于 1. 则 可 认为 of 一 si; E oi/o: 的 置信 区 间 包 含 1, 则 可 认为 中 一 于 。 
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练习 5.3 


. 由 取 自 正 态 总 体 X — Nu. 0.9), 容量 为 9 的 样本 ， 若 得 到 样本 均值 为 
cip: 的 置信 度 为 0. 95 的 置信 区 间 是 _ 
2. 已 知 某 种 材料 的 抗 压强 度 X — N Gu. 史 )， 现 随机 地 抽取 10 个 试 件 进行 搞 
压 试验 , 测 得 数据 如 下 : 482, 493, 457, 471, 510, 446, 435, 418, 394, 469, 
CD 求 平均 抗 压强 度 w 的 点 估计 值 ; 
© 求 平均 抗 压强 度 yy 的 95% 的 置信 区 间 ; 
© 若 已 知 vc 一 30, 求 平均 抗 压强 度 py 的 95% 的 置信 区 间 ; 
@ 求 的 点 估计 值 ; 
C) R o 的 95% 的 置信 区 间 ; 
© 求 o 的 点 估计 值 ; 
@@ 求 o 的 95% 的 置信 区 间 。 
3. 设 总 体 X — NGe 60. ò Cm, 问 样本 容量 取 多 大 时 才能 保证 4 的 
95% 的 置信 区 间 的 长 度 不 大 于 上 。 
4. 假设 0.50 ,1.25 ,0.80，2.00 是 取 自 总 体 X 的 样本 值 , 已 知 Y=InX 服 
从 正 态 分 布 X~NCp, D. 
四 求 X 的 数学 期 望 已 (X)( 并 记 开 (X) 一 0 
C 求 w 的 置信 度 为 95 中 的 置信 区 间 ， 
@ 利用 上 述 结果 求 和 的 置信 度 为 95%% 的 置信 区 间 。 
5. 设 从 总 体 X NGa s 64) 和 总 体 X 一 NGe ,36) 中 分 别 抽取 容量 为 由 一 75， 
一 50 的 独立 样本 ,可 计算 得 工 =82，y 一 76, R pu 一 pw 的 96% 的 置信 区 间 。 
6. 假设 人 体 身高 服从 正 态 分 布 , 今 抽 测 甲 、 乙 两 地 区 18 一 25 岁 女 青年 身高 
得 数据 如 下 : 甲 地 区 抽取 10 名 , 样本 均值 1. 64 米 , 样本 标准 差 0.2 米 ; 乙 地 区 抽 
取 10 名 , 样本 均值 1. 62 米 , 样本 标准 差 0.4 米 。 
R: @ 两 正 态 总 体 方差 比 的 99% 的 置信 区 间 ; 四 两 正 态 总 体 均值 差 的 99%% 的 
置信 区 间 。 


5.4 点 估计 法 
在 第 5. 2 节 中 , 我 们 寻找 总 体 未 知 参数 的 点 估计 都 是 根据 未 知 参数 的 特征 


(或 统计 意义 ) 去 寻找 具有 同类 特征 (或 统计 意义 ) 的 统计 量 来 实现 的 。 本 节 我 们 介 
绍 两 种 一 般 化 的 求 点 估计 的 方法 。 
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1. 矩 估 计 法 


所 谓 矩 估计 法 (moment method of estimate) , 就 是 将 总 体 的 各 阶 原点 矩 用 相 
应 阶 的 样本 原点 矩 替 代 , 布 列 方程 或 方程 组 所 得 到 的 解 ， 作 为 总 体 未 知 参数 的 点 
估计 的 方法 。 下 面 我 们 通过 例子 来 加 以 说 明 。 

例 5.4.1 设 总 体 X—UO, 0. Xi. Xo X, 为 取 自 该 总 体 的 样本 , 求 未 
知 参 数 9 的 矩 估 计量 。 


解 因为 E(X) 一 全 ,所 以 由 乡下 ,可 解 得 0 一 2, 故 未 知 参数 9 的 矩 估计 


量 为 9 二 2X。 
例 5.4.2 设 总 体 的 概率 密度 函数 为 


$:0—2 o<r<0 
fa) = 9 


0, 其 它 
Xo Xo X, 为 取 自 该 总 体 的 样本 。 
R: 未 知 参数 的 甜 估 计量 9; ODO. 
MOD 容易 计算 出 ECX) 二 各, -X. 解 得 0 一 2 又， 
所 以 ,未 知 参数 0 的 秆 估计 量 为 9 一 2X。 


O 因为 Dio - 4D -4x O9, gj go - 2, gae - 98, 


所 以 DOO SEX) -E =Ë, 
于 是 D» = 
on 


2. 最 大 似 然 估 计 法 (maximum-likelihood method of estimate) 


设 总 体 X 的 密度 函数 为 了 (z,， 0)，X,，X:，…，X。 为 取 自 该 总 体 的 样本 。 由 

第 3 章 的 概率 论 知识 可 知 , 随机 向 量 (X Xe ，…，X。) 的 联合 密度 函数 为 
了 一 LOz，z，…，xzoig) 一 rz, Dflzss O flen pb)， 

当 未 知 参数 0 固定 , 而 看 作 是 zx, ，x;，…, x, 的 函数 时 , 是 一 个 概率 密度 函数 

或 概率 函数 , 它 可 以 这 样 理解 : P LO ，y ，…， yo 00 LGn x. tm xa. 

则 在 对 总 体 进行 观测 时 ， 出现 点 (y,，ys，*…，y, ) 的 可 能 性 要 比 出 现 点 (zi， ms 

“， Xx,) 的 可 能 性 大 。 把 这 件 事 反 过 来 可 以 这 样 想 ， 当 nsns ccn. x 已 知 ( 已 经 

观测 到 (zi，zz, t nOD LG xs x 0600 (LG s x nai AD. 
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则 被 估计 的 未 知 参数 9 是 0, 的 可 能 性 要 比 是 4 的 可 能 性 大 。 当 ns tzes to om. 
固定 ,而 把 二 看 作 是 2 的 函数 时 , 称 工 为 “ 似 然 函数 (likelihood function)", 这 名 称 
的 意义 可 根据 上 述 分 析 得 到 。 这 函数 对 不 同 的 0 的 取 值 反映 了 在 观测 结果 xz， 
r.c mr, 已 知 的 条 件 下 6 的 各 种 值 的 “ 似 然 程度 ”。 注 意 这 里 有 些 像 贝 叶 斯 公式 
中 的 推理 , 把 观测 值 看 作 结果 ,把 参数 值 看 作 导 致 这 结果 的 原因 , 现 已 有 了 结果 ， 
要 反 过 来 推算 各 种 原因 的 概率 。 这 里 参数 9 有 一 定 的 值 ( 虽 然 未 知 ), 并 非 事件 或 
随机 变量 , 无 概率 可 言 , 于 是 就 改 用 “ 似 然 ” 这 个 词 。 从 以 上 分 析 就 自然 导致 如 下 
的 方法 : 应 该 用 似 然 程度 最 大 的 那个 9, 即 满足 条 件 
LG y Zas m x0) = Lig a2. cts my 0) 

的 去 作为 0 BHL. 因为 在 已 得 样本 rns c 的 条 件 下 ， 这 个 六 看 来 最 
像 " 是 真 参数 值 。 这 个 估计 8 就 叫做 0 RE esti- 
mate) 。 由 于 函数 Inz 的 单调 增加 性 ， 所 以 使 L 达到 最 大 等 价 于 使 InL 达到 最 大 ， 
因此 , 我 们 经 常 使 用 对 数 似 然 函数 InL 来 求 最 大 似 然 估计 。 

$15.4.3 设 总 体 X 的 概率 密度 函数 为 
J(0+Dz, 0<z<l1 

0, 其 它 
其 中 未 知 参 数 02 —1. Xi. Xi. ts X, 为 取 自 该 总 体 的 样本 。 求 : 9 的 最 大 似 然 
Jill RECT). 

解 ”首先 写 出 似 然 函数 为 

L= Cry xi, t Eas 0) = fGn s Of Gri 0) f Gr, 0) 
_ [OHI CEE), OLE zr, cord 
i | 0， 其 它 


M Oa. xp, rnt. 2, <l Bf. InL— nlnC92- D 4-0eln Gri 22 x, s ^ lnL-; FH 


f(z) = 


In(ziza…zn) 一 0,， MR G7 — 150 7— — —1. 所 以 ,0 的 最 大 似 然 估 计 为 : 


InCri zz 7, 


à-- -1. 


IMS. MED 
InCX X;— X) 
又 因为 e =X, XX, 


所 以 Ele 53) -ECX Xo X,) -LEOO ]" -ó. 


其 中 ECX) =[ 0+ Dade = Hi t 


例 5.4.4 iE X—BG, p) 求 户 的 最 大 似 然 估计 。 
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BS BX, Xs X, HRA XB, DREZ. MARR 
L= LGry «xe. ts x 0) = fr, Df ra, 0) firn 0) 
= Ch pa (1 — p= Chp (lp) pA p 
对 数 似 然 函 数 为 








InL = In(Cz Cz Cz) + (Dr)lnpt+ Dn—zr)ln(l— p) 
f. A zB 
^ 
EM T E 
dp. 7 5 (25) 155220 z)=0 
解 得 


P 
pc 


BC) LX 为 /的 最 大 似 然 估计 。 


例 5.4.5 HXi, Xie X, 是 从 服从 均匀 分 布 U(0, 9) 的 总 体 中 抽取 的 样 
本 , 求 9 的 最 大 似 然 估 计 。 
解 ”因为 总 体 X 的 分 布 密度 函数 为 


1 
下 

ren i 
o XE 


所 以 , 似 然 函数 为 
L= LGr s trs s x3 D = flr, Of Gr 0) f Gr, 0) 


-[r O< ais zc n <O 
0, 其 它 


为 使 似 然 函 数 LL. 达到 最 大 , 0 必须 尽量 地 小 , 但 又 不 能 太 小 以 致 工 为 0。 注 意 到 
0< ziy Tzs tt. xr, 即 0<<min(z，zz，…，zo)，max(zi，zz，…，xzo)<0 所 


DURÓ — max(X, ，X:，…，X,)， 易 见 ， 当 07 WL— L0. "$00 mt, L=0, 


故 唯一 使 二 达到 最 大 的 0 值 , BD 0 RAKWA H — max (Xi. Xas s X. 

比较 例 5. 4. 1 与 例 5.4.5, 可 见 , 同一 个 总 体 未知 参 数 的 矩 估计 和 最 大 似 然 
估计 可 能 是 不 相同 的 , 直观 上 可 知 , 9 的 最 大 似 然 估计 9 二 max(Xi， Xs， n X) 
不 是 无 偏 估计 , 而 是 偏 低 的 , 事实 上 , 我 们 可 以 计算 出 9 的 最 大 似 然 估计 为 9 二 
max(X, . X. «e. XX, ) 的 数学 期 望 为 一 -0<9, 关于 这 两 个 估计 的 优 劣 评选 读者 


n+l 
可 进一步 研讨 。 
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练习 5.4 


1. 已 知 总 体 X 服从 瑞 利 分 布 , 其 密度 函数 为 


Ap- 人 5 ， x0 
0, Z<0 
未 知 参数 >O, Xis Xare X, 为 取 自 该 总 体 的 样本 。 求 9 的 矩 估计 量 和 最 大 似 
然 估计 量 ， 并 问 这 两 个 估计 量 是 不 是 无 偏 估 计量 ? 
2. 设 总 体 X 的 对 数 函 数 InX 服从 正 态 分 布 N Gi o), Xis Xon XS 
自 总 体 X 的 样本 , R y o^ 及 E(X) 的 最 大 似 然 估 计量 。 
3. 已 知 总 体 X. 服从 参数 为 6 的 泊 松 分 布 , 其 分 布 律 为 


POCO o the ^. k=0, 1, 2, =, 9>0 


Xis Xas ces X, 为 取 自 总 体 X WEZ. RO 0 的 矩 估 计量 ; @ 9 的 最 大 似 然 估计 
ut; © o 的 无 偏 估 计量 。 


第 6 章 统计 检验 


在 第 5 章 中 , 我 们 介绍 了 统计 推断 的 一 类 方法 一 一 未 知 参数 的 统计 估 值 .总 
体 未 知 参数 的 点 估计 与 区 间 估 计 问题 。 在 有 些 实际 问题 中 ,需要 我 们 知道 总 体 的 
未 知 参数 有 无 明显 变化 , 或 是 否 达 到 既定 的 要 求 ,或 多 个 总 体 的 某 个 参数 有 无 明 
显 差异 , 等 等 。 诸 如 此 类 问题 , 就 是 我 们 在 本 章 将 要 介绍 的 统计 推断 的 男 一 类 方 
法 一 一 统计 检验 所 要 解决 的 问题 。 


6.1 统计 检验 概要 


先 举 两 个 例子 。 

例 6.1.1 某 工厂 生产 大 批 的 电子 元 件 , 假定 元 件 的 寿命 服从 指数 分 布 
EO), 在 实际 应 用 中 , 我 们 可 以 提出 许多 感 兴趣 的 问题 , 例如 ; @ 元 件 的 平均 寿 
命 如 何 ? @ 如 果 你 是 消费 者 , 要 求 平均 寿命 能 够 达到 某 个 指定 的 & 值 (比如 5000 
小 时 ), 间 这 批 元 件 可 否 被 不 拒绝 ? 


对 于 第 一 个 问题 ， 因为 总 体 平均 为 工 ， 而 4 是 未 知 的 , 我 们 只 好 从 总 体 中 随 


机 抽取 ?个 ,测量 其 寿命 为 义 ,，X,，…，X, 构成 样本 值 ， 然后 依据 样本 值 对 填 作 


出 估计 ， 这 就 是 前 一 章 研究 过 的 内 容 。 

对 于 第 二 个 问题 ,可 能 认为 〈 至 少 对 本 例 而 言 ) : 解决 了 第 一 个 问题 也 就 解 
决 了 第 二 个 问题 , 因为 既然 用 样本 均值 X 去 估计 平均 寿命 , 那 就 看 X 是 否 不 小 
于 指定 的 值 *, XI. 则 不 拒绝 这 批 元 件 , 不 然 就 拒绝 。 应 当 承 认 这 是 一 个 可 
以 考虑 的 解法 。 但 还 应 注意 到 , 样本 均值 X 估计 总 体 平均 寿命 有 误差 , 我 们 必须 
根据 实际 需要 进行 一 定 的 调整 。 即 把 不 拒绝 的 准则 定 为 X294. k 是 某 个 选 定 的 
fü, MNF EF AKF k. ki 定 的 大 些 , 表示 检验 更 严格 , 这 在 对 元 件 质量 要 
求 很 高 且 供 货 渠 道 较 多 时 可 能 是 适当 的 。 反 之 ,k 定 的 小 些 , 表示 检验 更 宽 , 这 
在 对 元 件 质 量 要求 不 很 高 或 急需 这 些 元 件 而 供 货 渠 道 很 少时 , 也 可 能 采取 。 从 统 
计 上 说 , 无 论 怎样 定名， 理论 上 都 可 能 犯 两 种 错误 之 一 : 一 是 元 件 平均 寿命 达到 
需求 而 被 拒绝 ; 一 是 元 件 平均 寿命 达 不 到 需求 而 被 拒绝 。 这 两 种 错误 各 有 一 定 的 
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规律 ,它们 在 很 大 程度 上 决定 了 不 拒绝 准则 X9, 中 的 选择 。 

第 二 个 问题 与 第 一 个 问题 不 同 , 它 不 是 要 求 对 分 布 中 的 未 知 参数 作出 估计 ,而 
是 要 在 两 个 决定 (对 本 例 而 言 就 是 不 拒绝 或 拒 收 该 批 产 品 ) 中 选择 一 个 。 

例 6.1.2 某 食品 加 工厂 用 自动 包装 机 包装 苗条 ,定额 标准 为 每 袋 净 重量 
0.5 千克 , 设 在 正常 情况 下 包装 机 称 得 苗条 重量 服从 正 态 分 布 N(0. 5, 0. 0001)， 
根据 长 期 经 验 知 其 标准 差 不 变 。 为 检验 包装 机 工作 是 否 正常 , 随机 抽 测 16 袋 莫 
Ak. 其 净重 (单位 :千克 ) 为 

0. 499, 0.514, 0.508, 0.512, 0. 498, 0.515, 0. 516, 0.511, 0. 524, 0.499, 
0.499, 0. 500, 0. 505, 0. 497, 0. 490, 0.510, 

间 : 该 包装 机 工作 是 否 正常 ? 

在 这 个 问题 中 , 首先 样本 是 从 总 体 IN Gu» 0. 0001) 中 抽取 的 , 包装 机 工作 是 否 
正常 ,就 是 看 是 否 等 于 0.5， 即 w=0.5 是 否 成 立 ? 车 成 立 , 则 认为 正常 ; 若 不 
成 立 ， 则 认为 不 正常 。 同 样 是 从 jy 二 0.5 与 i60. 5 两 个 决定 中 选择 一 个 。 

在 实践 中 , 类 似 的 问题 还 有 很 多 很 多 。 在 统计 学 上 , 首先 是 对 问题 发 表 “ 看 
I4”, 称 之 为 “假设 (hypothesis)”; 再 依据 样本 , 用 一 定 的 方法 论证 这 一 “假设 ”是 
否 成 立 , 称 之 为 “统计 检验 (statistic test)". 

一 般 地 , 我 们 称 关于 总 体 X 的 各 种 论断 为 统计 假设 (statistic hypothesis) ， 简 
称 假设 , HH Aon. dn 6.1.2 rp, 可 设 Ho * pr 一 0.5, 也 可 设 H, : wp 天 0.5, € 
们 是 相互 对 立 的 假设 。 通常 称 Ho 为 基本 假设 (或 原 假设 , 零 建设 , 解 消 假设 ), 而 
称 Hi Ho 的 对 立 假设 (或 备 择 假 设 , 备 选 假 设 )。 所 有 的 统计 假设 都 由 两 部 分 
组 成 ,一 个 原 假 设 和 一 个 备 择 假设 。 所 构造 出 来 的 这 两 个 假设 包含 了 试验 或 研究 
的 所 有 可 能 结果 。 一 般 而 言 , 原 假设 (null hypothesis) 阐 述 的 是 “ 原 ” 条 件 存 在 的 情 
形 , 也 即 没有 新 事物 出 现 , 原 来 的 理论 仍然 正确 ,原来 的 标准 仍然 适用 ,原来 的 系统 
没有 被 打 乱 。 备 择 假 设 (alternative hypothesis) 则 相反 , 它 阐 述 的 是 ,新 理论 才 是 
正确 的 ,系统 已 经 混乱 以 及 (或 ) 新 事物 出 现 了 。 再 举 个 例子 来 说 ,假定 一 个 面粉 加 
工厂 包装 的 面粉 按 重 量 出 售 ;一 种 特定 大 小 的 包装 平均 质量 为 10 kg。 假 如 该 厂 
想 检 验 其 包装 流程 是 否 正常 工作 (以 面粉 包装 的 重量 为 依据 )。 该 试验 的 原 假设 就 
是 面粉 包装 的 平均 重量 为 10 kg (工作 正常 ), 备 择 假设 是 面粉 包装 的 平均 重量 不 
是 10 kg( 流 程 出 错 )。“ 假 设 " 这 个 词 在 此 就 是 一 个 其 正确 与 否 有 待 通过 样本 去 判 
断 的 陈述 ,不 能 与 数学 上 常 说 的 “假设 ……” 之 类 的 话 相 混 , 后 者 是 一 个 所 讨论 的 
问题 中 已 被 承认 的 前 提 或 条 件 。 而 “检验 ”一 词 就 是 对 “假设 ”正确 与 否 的 “判断 ”。 


1. 统计 检验 的 基本 思想 
在 例 6. 1. 2 中 , 基本 假设 Ho * pps 二 0.5, HRH H, : apes Hy ROSE 
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VERG. 我们 自然 联想 到 样本 均值 和 ,根据 样本 值 , 我 们 可 计算 出 +, zx 与 pw 之 
间 存 在 差异 。 对 这 个 差异 有 两 个 解释 , 一 是 这 差异 由 抽样 的 随机 性 造成 ,而 Ho 
成 立 , 即 包装 机 工作 正常 ; 一 是 这 差异 由 包装 机 工作 不 正常 造成 , 即 H 不 成 立 
H, 成立. 到底 哪 一 个 解释 比较 合理 呢 ? 

首先 ,统计 问题 中 不 能 要 求 工 与 we 之 间 没有 差异 ， 从 直观 的 角度 分 析 , 如 果 
包装 机 工作 正常 , 即 Ho 成 立 , 那么 工 与 ws 之 间 应 该 相差 不 大 ; 反 过 来 ， 若 工 与 
po 之 间 相差 很 大 , 我 们 自然 应 当 怀 疑 Hos UH H, 不 成 立 ， 即 包装 机 工作 不 正 
We RIKT 与 jo 的 差异 ”“ 应 该 相差 不 大 ”、“ 相 差 很 大 ”这 样 的 直观 描述 定量 
ft. 刚才 说 到 “容许 有 差异 ”， 即 | 叉 一 pwo 1 二,“ 应 该 相差 不 大 ”， 即 “差异 不 大 "的 
概率 要 大 , 或 “差异 大 "的 概率 要 小 , MPX- ml 720 a RAIN EO , 这 样 就 
考虑 了 “差异 "与 “出 现 差 异 " 的 可 能 性 之 间 的 关系 。X 用 来 描写 "差异 "的 度 , 称 之 
为 临界 值 , a 用 来 描写 “差异 "的 可 能 性 , 称 之 为 显著 性 水 平 (significance level) (或 
检验 水 平 (critical value))。 若 在 Ho 成立 的 条 件 下 ，P( | 六 一 jw |>) Sa, 说 明 事 
ELIX — po | 27A VE Ho 成 立 下 出 现 的 概率 很 小 , 称 为 (条 件 ) 小 概率 事件 ， 而 小 概 
率 事件 在 一 次 试验 (或 一 次 抽取 ) 中 是 几乎 不 可 能 出 现 的 , 称 为 实际 推断 原理 (或 小 
概率 原理 ) 。 若 一 次 抽样 ， 小 概率 事件 {| 玉 一 po | 之 人 } 出 现 了 , BIX s | 09a. JN 
认为 “差异 ”超过 了 一 定 的 度 , 作出 的 判断 是 : H。 不 成 立 , 即 要 拒绝 Hs. 

再 回 到 例 6.1.2 中 , 对 给 定 的 a 二 0.05, 由 于 又 一 Neo, 上 2995), 则 当 H, 成 


立时 , 就 有 





-一 一 名 = 40(X — p) ~ NO(O, 1) 
0. 0001 
16 





PC 40 — pm) |> z4) = PC X — |> doe = 0. 05 = a 


因此 ， 4 |X — je |> dtes LE 则 认为 Ho 不 成 立 , 拒绝 Hos BAKUR 
工作 不 正常 ; 否则 , 不 拒绝 H, 认为 包装 机 工作 正常 。 
这 里 再 说 明 一 点 , 在 许多 文献 中 ， 把 检验 准则 | 和 一。 |> n e BORA EROR 
3 


p PQZI eb, gp ZANO, D, d$ pas 则 拒绝 He, # p>a 则 不 


Yn 
拒绝 Ho. 
一 般 把 这 两 种 方法 分 别称 为 临界 值 法 和 概 值 法 。 
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2. 统计 检验 的 实施 程序 


Stepl 根据 题 意 明 确 总 体 , 合理 地 建立 基本 假设 H。 和 备 择 假 设 Hi; 当 H, 
位 于 Hy 的 两 侧 时 ， 被 称 之 为 双 侧 检验 ; 当 H, 位 于 Ho 的 一 侧 时 , 被 称 之 为 单 侧 
检验 。 

Step2 ”选择 适当 的 检验 统计 量 (test statistic), 要 求 在 H。 为 真 时 , 统计 量 的 
分 布 是 确定 和 已 知 的。 

Step3 ”规定 检验 水 平 a, 并 由 基本 假设 H。 和 备 择 假设 H 确定 一 个 合理 的 
拒绝 Ho 的 条 件 。 

Step4 由 样本 值 计算 出 检验 统计 量 的 值 。 

Step5 作出 判断 : 若 统计 量 的 值 满足 拒绝 条 件 , 则 拒绝 Ho, 否则 不 拒绝 
Ho. 

以 上 过 程 可 由 SPSS 实现 . 在 上 述 程序 中 ， Stepl 是 前 提 ，Step2 是 关键 。 值 
得 注意 的 是 : 做 假设 检验 用 的 统计 量 与 参数 区 间 估 计 用 的 随机 变量 在 形式 上 是 一 
致 的 , 每 一 个 区 间 估 计 法 都 对 应 一 个 假设 检验 法 。 


3. 两 类 错误 


当 我 们 根据 抽样 结果 而 不 拒绝 或 拒绝 一 个 假设 时 , 这 只 是 表明 我 们 的 二 种 判 
断 。 由 于 样本 有 随机 性 ,这样 作出 的 判断 就 可 能 犯错 误 。 
第 一 类 错误 (type one error): 弃 真 , 即 Ho 成 立 而 误 认为 Ho 不 成 立 , 犯 第 一 
类 错误 是 因为 拒绝 了 一 个 正确 的 原 假 设 。 例 如 ,假定 面粉 包装 流程 正常 工作 ,每 袋 
面粉 平均 重量 10 千克 。 又 假定 研究 人 员 随 机 抽取 100 4 , 称 出 每 袋 重 量 后 计算 样 
本 均值 ,有 时 可 能 碰巧 抽取 了 100 袋 比较 极端 的 (最 重 的 或 最 轻 的 ) ,这 样 就 会 得 到 
“个 落 入 拒绝 域 的 均值 。 结 果 是 拒绝 原 假设 ,尽管 总 体 均值 确实 是 10 千克 。 在 这 
种 情况 下 ,研究 人 员 就 犯 了 第 一 类 错误 。 在 统计 假设 检验 以 外 的 活动 中 第 一 类 错 
误 的 说 法 也 存在 。 比 如 ,一 名 经 理解 雇 了 一 名 雇员 ,因为 有 证 据 表 明 他 在 公司 盗 
窃 , 如 果 他 实际 上 并 没有 在 公司 盗窃 ,那么 该 经 理 就 犯 了 第 一 类 错误 。 再 比如 , 假 
定 一 家 大 型 制造 企业 装配 生产 线 上 的 一 名 工人 在 听 到 异常 声音 后 决定 停止 生产 线 
(拒绝 原 假设 )。 如 果 后 来 发 现 声音 和 装配 线 没 有 关联 ,装配 线 上 没有 出 现任 何故 
障 , 那 么 该 工人 就 犯 了 第 一 类 错误 。 在 法 庭 上 ,也 有 第 一 类 错误 的 类 似 例子 , 那 就 
是 一 个 无 束 的 人 被 判 人 狱 。 易 见 , 弃 真 错误 出 现 的 概率 (最 大 值 ) 为 (显著 性 水 平 
Clevel of significance) ) 。 


第 二 类 错误 (type two error): Wh, M H 不 成 立 而 误 认为 Ho 成 立 。 当 研 
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究 人 员 没有 能 拒绝 一 个 错误 的 原 假设 时 ,他 就 犯 了 第 二 类 错误 。 犯 第 二 类 错误 的 
概率 通常 记 为 8。 与 “不同 的 是 ,8 通常 不 会 在 假设 检验 程序 开始 时 就 给 出 。 实 际 
上 因为 只 有 当 原 假设 不 正确 时 8 才 存 在 ,所 以 8 的 计算 会 因 可 能 存在 的 备 择 参 数 
不 同 而 不 同 。 例 如 ,在 面粉 包装 问题 中 ,如 果 总 体 均值 不 是 10 千克 , 那 它 是 多 少 
呢 ? 可 能 是 12 千克 ,也 可 能 是 8 千克 。 有 8 的 值 与 每 个 备 择 的 均值 相对 应 。 

a 和 有 有 什么 关联 呢 ? 首先 ,因为 只 有 当 原 假设 被 拒绝 时 , 才 存 在 a; 当 不 拒绝 
原 假 设 时 , 才 存在 6。 所 以 在 同一 次 的 假设 检验 中 ,研究 人 员 不 可 能 同时 犯 第 一 类 
错误 和 第 二 类 错误 。 

我 们 自然 希望 犯 这 两 类 错误 的 概率 越 小 越 好 , 但 样本 容量 ”确定 之 后 , 犯 这 
两 类 错误 的 概率 不 可 能 同时 被 控制 , 减 小 其 中 一 个 , 另 一 个 往往 会 增 大 。a 越 小 ， 
拒绝 域 就 越 窗 , 也 即 拒绝 原 假设 就 更 难 ,接受 原 假设 就 更 容易 。 比 如 对 加 工装 配 
线 , 如 果 管 理 体制 使 工人 们 不 能 轻易 地 关闭 装配 线 ( 减 少 了 第 一 类 错误 ) ,那么 生产 
出 质量 差 的 产品 或 装配 线 发 生 严重 问题 的 机 会 就 会 更 大 了 ( 增 大 了 第 二 类 错误 的 
概率 )。 

一 种 能 同时 减 小 两 种 错误 的 方法 是 增加 样本 容量 。 如 果 选 取 的 样本 容量 变 
大 ,那么 样本 就 更 能 代表 总 体 , 这 也 就 意味 着 研究 人 员 做 出 正确 选择 的 机 会 更 大 。 

如 果 把 事物 的 实际 面目 称 为 “本 质 状 态 ”, 研 究 人 员 实 际 做 出 的 决策 称 为 * 结 
论 ”"。 而 每 个 备 择 的 “结论 "都 只 包含 一 类 错误 ,以 及 作出 正确 决策 的 概率 。 当 原 假 
设 错误 时 ,拒绝 原 假设 的 概率 1 一 8 一 般 称 为 “ 势 "。a、B 与 势 的 关系 见 下 表 6. 1. 1。 

















表 6.1.1 两 类 错误 
本 质 状态 
原 假设 正确 原 假 设 错误 
"m 不 拒绝 原 假设 正确 决策 第 二 类 错误 (B) 
拒绝 原 假设 第 一 类 错误 (a) 正确 决策 ( 势 ) 





LOT ELT 


在 实践 中 , 通常 采用 的 做 法 是 : 控制 犯 弃 真 错误 的 概率 不 超过 某 个 事先 给 定 
的 显著 性 水 平 a( 很 小 的 正 数 ), 而 使 犯 取 伪 错误 的 概率 尽 可 能 得 小 。 

如 果 我 们 仅 要 求 犯 弃 真 错误 的 概率 等 于 a, 则 这 类 统计 检验 问题 即 为 显著 性 
检验 问题 。 正 因为 显著 性 检验 只 给 出 了 犯 弃 真 错误 的 控制 标准 a, 实际 中 恰当 地 
选取 Ho 就 尤为 重要 了 。 一 般 地 , 可 据 以 下 原则 选取 H.: O 当 我 们 的 目的 是 希望 
从 样本 值 中 取得 对 某 一 论断 的 强 有 力 的 支持 时 , 把 这 一 论断 的 对 立 面 作为 基本 假 
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设 Hs © 尽 可 能 使 后 果 严 重 的 一 类 错误 作为 第 一 类 错误 ; @ 把 由 历史 资料 所 提 
供 的 论断 作为 基本 假设 H。。 当 检验 结论 为 拒绝 HH。 时, 由 于 犯 弃 真 错误 的 概率 被 
控制 而 显得 有 说 服 力 和 危害 较 小 ; 当 检 验 结论 为 不 拒绝 Ho。 时 ， 因 不 拒绝 的 理由 
是 抽样 的 结果 与 H 无 矛盾 ,或 者 说 没有 找到 拒绝 Ho 的 理由 , 故 检验 结果 是 没 
有 说 服 力 的 , 并 且 犯 取 伪 错误 的 概率 还 不 受 控制 所 以 通常 在 不 拒绝 Ho 时 ,为 可 
靠 起 见 , 还 须 进 一 步 进行 抽样 检验 。 


6.2 单 正 态 总 体 的 统计 检验 及 SPSS 实现 





设 总 体 X~N Cu, d), Xl，Xs，…，X, 为 取 自 该 总 体 的 样本 。 


1. 期 望 的 检验 


(1) 当 总 体 方差 # 已 知 时 
O Hs t p=po (BA, H, * pp. 


在 Ho * pps liL IE Z2 3 NC. D, BOTRE a 
Ju 
由 PCOZI 24) ma 可 求 得 : Hs pps 的 拒绝 条 件 为 
121> z 


通常 称 此 检验 为 Z 检验 . 
© H, t ny (BA, Hi? p>. 由 于 在 H。: p<p 成 立 的 条 件 下 有 


quM X-p X-a 
X-u cX, 所 以 对 给 定 的 。 就 有 | z le z 7 
CERE a bw 

Ko 4 


n 


Zr 


Es, 


P <P| s 
Yn 





= 故 H。: ups 的 拒绝 条 件 为 








E> 
图 Ho * p>p (BAD, H, * jy 过 jo。 类 似 地 ，H。: pn 的 拒绝 条 件 为 
Z«—z 


(2) 当 总 体 方差 未 知 时 

同 第 5 章 未 知 参数 区 间 估计 一 样 ， 只 需 将 检验 统计 量 Z 中 的 未 知 参数 总 体 标 
准 差 替换 成 样本 标准 差 S 便 可 得 以 上 三 种 情形 各 对 应 的 基本 假设 的 拒绝 条 件 。 
现 列表 6.2.1 如 下 。 
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表 6.2.1 
总 体 方差 已 知 总 体 方差 RA 
检验 统计 量 检验 统计 量 
一 和 -wm Xp 
Hs Hi et TUS 
Vn dn 
(Z 检验 ) (TRH) 
在 显著 性 水 平 下 的 Ho 的 拒绝 条 件 
"m B ps IZl>zş ITI>t4 (1-1) 
p "m Z»z | T>, (n—1) 
>p "o Z<- T<—i,(n—1) 





例 6.2.1 两 厂 生产 同一 产品 , 其 质量 指标 假定 都 服从 正 态 分 布 , 标准 规格 
为 均值 等 于 120。 现 从 甲 厂 抽 出 5 件 产品 测 得 其 指标 值 为 
119. 0, 120. 0, 119.2, 119.7, 119.6 
从 乙 厂 也 抽取 5 件 产品 , 测 得 其 指标 值 为 
110. 5, 106. 3, 122.2, 113.8, 117.2 
要 根据 这 些 数据 去 判断 这 两 厂 产品 是 否 符合 预定 规格 120? (显著 性 水 平 0. 05) 。 
解 ” 设 甲 厂 产 品 指标 服从 正 态 分 布 NCo , oj),， 乙 厂 产品 指标 服从 正 态 分 布 
NGa v oi). oi Hoi HRA. 
首先 ,建立 数据 文件 表 6. 2. 2( 见 SPSS 数据 文件 例 6. 2. D. 
表 6.2.2 两 厂 抽取 的 产品 质量 指标 
Edit View Data Transform Analyze : 


| =| =|| «Jj 












1105 
1200 106.3 
1192 1222 . 
1197 1138 
4196 117.2 


IET, Ho : p=p=120, H, : p Ap —120 进行 双 侧 工 检验 。 
HZI, H's : p=p=120, H’, * pepo =120 进行 双 侧 工 检验 。 
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其 次 ,在 SPSS 数据 编辑 窗口 ,依次 调用 程序 如 图 6. 2. 1 所 示 。 


Edit View Data Transforn SPSSAddins Graphs Utilities Window Help 


JOD Eee" EM a 








» 
Tables » 

x y Coapar , 
El 1190 T105 General Linear Model » 
-了 1200 1063 Mixed Models ^ — Independent-Ssmples T Test. 
3| 1192 1222 Correlate ， Paired-Sanples T Test 

1 Begression ， One-Way ANOVA... 
4 119.7 113.8 
5] Loglinear Pynpiem m 
5| 119.6 117.2 eeii N 
M 6.2.1 





得 到 对 话 框 并 按照 需要 勾 选 相应 的 项 (如 图 6. 2. 25. 














Test Variable(s] 
| Ò P RARBG [x] TPE 
分 乙 厂 产品 质量 指标 UI Poste 
| Reset 
| Cancel 
| Heb 
Testyaue [120 — Options. 









One-Saaple T Test: 
Confidence Interval: [99 x 
Missing Values 

© Exclude cases analysis by analysis 
C Exclude cases jlstwise 


Options 











图 6.2.2 


再 点 击 Continue OK , 便 得 到 输出 结果 如 表 6. 2. 3 和 表 6. 2. 4。 


表 6.2.3 One-Sample Statistics 








| N Mean | Std. Deviation | Std. Error Mean 








甲 厂 产品 质量 指标 5 119.500 | .4000 .1789 
乙 厂 产品 质量 指标 5 





| 
114. 000 | 6. 1045 2. 7300 
L 
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表 6.2.4 One-Sample Test 





























Test Value — 120 
95% Confidence Interval 
i af Sig, Mem of the Difference 
(2-tailed) | Difference | — — — — 4,— 
Lower | Upper 
申 厂 产品 质量 指标 |—2.795| 4 -049 一 . 500 —.997 —.003 
乙 厂 产品 质量 指标 | 一 2.198| 4 .093 -6.000 | 一 13.580 1.580 





HF t Qr 7 D) — tos (4) 一 2.776, 而 对 于 甲 厂 (— — 2. 795, HX | — 2. 795| > 
2.776, 所 以 应 当 拒绝 基本 假设 Ho : pa = 一生 二 120, 即 甲 厂 产品 与 预定 规格 不 符 。 对 
FZI (一 一 2. 198, 因 为 | 一 2. 198| —2. 776, 所 以 结论 是 不 拒绝 基本 假设 H'。: 
p =p 二 120,， 即 未 发 现 乙 厂 产品 不 符合 预定 规格 的 有 力 证 据 。 

以 上 检验 方法 称 为 “临界 值 法 ”, 此 外 , 我们 还 经 常用 另 一 种 检验 方法 , 称 为 
“ 概 值 法 ”。 对 于 甲 厂 而 言 , 即 计算 概 值 p— PGOYVT- 72 1D) PGG(D 之 2.795) 一 
0. 049, 因为 p«—0. 05—a. 所 以 也 应 当 拒绝 基本 假设 Ho : jp — s 120, 即 认为 甲 
厂 产品 与 预定 规格 不 符 。 对 于 乙 厂 而 言 .如 =0.093 二 0.05=w, 所 以 应 当 不 拒绝 基 
本 假设 H's * p =p 320. 即 未 发 现 乙 厂 产品 不 符合 预定 规格 的 有 力 证 据 。 

户 值 的 确定 方法 如 图 6.2.3 示 。 

如 上 结论 可 能 使 不 少 人 感到 难以 接受 , 因为 甲 厂 5 件 产品 都 与 标准 规格 相差 
很 少 , 反倒 认为 不 合格 , 而 乙 厂 5 件 中 除 一 件 外 , 都 比 规格 值 低 不 少 , 反倒 认为 
可 以 通过 , 这 是 为 什么 ? 

首先 , HI Bg S—o. 4 远 低 于 乙 厂 的 S=6. 10507, 这 表明 甲 厂 产品 规格 比 乙 
厂 稳定 得 多 , 也 正 因为 甲 厂 产品 规格 很 齐整 (误差 很 小 )， 所 以 , 与 规格 值 120 的 
稍微 差别 (此 处 + 三 119.5 比 120 仅 差 0. 5) 也 被 检 出 来 了 。 不 能 不 承认 : 甲 厂 产品 
的 平均 规格 , 有 很 大 可 能 略 低 于 规格 值 120, 虽 只 略 低 些 , 也 是 事实 , 不 能 委 之 于 
随机 误差 。 至 于 这 样 一 个 差别 的 实际 重要 性 如 何 , 那 要 另 当 别论 了 。 此 处 只 讲 统 
计 上 的 显著 性 一 一 即 误差 不 能 用 随机 误差 去 解释 。 统 计 上 显著 不 一 定 有 现实 重要 
TE. 

乙 厂 抽出 的 5 件 产品 有 4 件 的 指标 远 低 于 规格 值 120. 使 我 们 很 有 理由 怀疑 : 
乙 厂 产品 平均 指标 达 不 到 规格 值 120, 但 由 于 乙 厂 产品 质量 波动 太 大 ,所 测 数据 
尚 不 能 很 有 把 握 认 为 其 平均 指标 确 与 120 有 差距 , 而 非 随机 性 影响 所 致 , 就 是 说 ， 
现 有 数据 可 能 太 少 了 些 。 所 以 对 乙 厂 我 们 首先 认为 : 其 产品 质量 波动 太 大 应 当 改 
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户 值 = 检验 统计 思 值 = 检验 统计 
时 左边 的 面积 量 右边 的 面积 


p fii 户 值 的 一 半 PAM piti 
检验 统计 量 检验 统计 量 检验 统计 量 检验 统计 量 


图 6.2.3 





it. 至 于 其 平均 指标 是 否 与 120 有 差距 的 问题 , 可 以 再 补充 一 些 数据 再 检验 ， 最 
好 是 先 采取 措施 把 方差 缩小 些 再 决定 这 个 问题 。 

例 6.2.2 一 家 食品 加 工 公 司 的 质量 管理 部 门 规定 ， 某 种 包装 食品 每 包 净重 
不 得 少 于 20 千克 , 经 验 表明 , 重量 近似 服从 正 态 分 布 , 假定 得 到 50 包 食品 构成 
的 样本 为 

19.5, 19.0, 20.1, 21.0, 18. 9, 20.3, 21.5, 18.8, 19. 6, 19.8, 

19.8, 19. 6, 19.6, 18. 9, 17. 8, 18.0, 20. 0, 20.3, 21.0, 21.2, 

18.5, 19. 9, 20. 6, 20. 1, 21. 1, 22.0, 20.8, 20.4, 20. 4, 20.3, 

19.5, 19.5, 20.0, 21. 0, 18. 9. 19.6, 19.8, 20.0, 21.0, 20.1, 

20.0, 18. 8, 18.9, 20.0, 21.0, 19.6, 19. 8 19. 6, 20.0, 19.9, 

问 有 无 充分 证 据说 明 这 些 包装 食品 的 平均 重量 减少 了 ? 

解 ” 依 题 意 , 总 体 为 : 包装 食品 每 袋 净重 量 X — NOS P), 如 果 把 平均 重量 
保持 不 变 或 增加 作为 基本 假设 的 内 容 , 那么 只 要 能 拒绝 基本 假设 , 就 能 说 明 样 本 
数据 提供 了 充分 证 据说 明 平 均 重量 减少 了 。 这 个 理由 暗示 了 应 建立 如 下 的 假设 
( 单 侧 检验 ) 
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Ho : p21 =20, H, : up 
建立 SPSS 数据 文件 ( 表 6. 2. 5, 见 SPSS 数据 文件 例 6. 2. 2)， 


表 6.2.5 S0 包 食品 重量 








SPSSAddins Graphs Utilities Window Help 
Reports , 

nciuv sumus OI 

Tables 















General Linear Model 


Mixed Models ndent-Sunples T Test. 


Paired-Sanples T Test. 


Correlate 
Regression One-Way ANOVA. 
Loglinear ——À 
Classify 


M 6.2.4 


在 SPSS 数据 编辑 窗口 ,依次 调用 程序 如 图 6. 2. 4 所 示 。 得 到 对 话 框 并 按照 


需要 勾 选 相应 的 项 (如 图 6. 2. 5) 。 
再 点 击 Continue>OK , 便 得 到 输出 结果 如 表 6. 2. 6 和 表 6. 2.7。 
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re-Saaple T Test: Options 


3& 6.2.6  One-Sample Statistics 





N | Std. Deviation |Std. Error Mean 
甲 厂 产品 质量 指标 50 19. 916 | .8674 .1227 


36.2.7. One-Sample Test 














Test Value — 20 





95% Confidence Interval 
Sig. Mean 


t df of the Difference 
(2-tailed) | Difference 





Lower Upper 
甲 三 产品 质量 指标 | 一 .685 | 49 .497 一 .084 —.331 .163 


























ili p— 1X 0. 491—0, 2485>a=0. 05, 所 以 , 不 拒绝 基本 假设 Ho * py = 


20. 即 没有 充分 证 据说 明 这 些 包 装 食品 的 平均 重量 减少 了 。 

当 样 本 容量 超过 30 时 ,上 检验 的 临界 值 (或 概 值 ) 可 以 用 = 检验 的 临界 值 (或 概 
值 ) 近 似 代替 。 

下 面 看 这 样 一 个 例子 。 

研究 人 员 试 图 找 出 “客户 服务 对 经 理 人 员 很 重要 "的 原因 , 便 调查 了 制造 厂 甲 
的 管理 领导 。 提 出 的 原因 之 一 是 ,客户 服务 是 一 种 留 住 顾客 的 方法 。 若 以 1 一 5 计 
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分 (1 为 低 ,5 为 高 ), 调 查 回 应 者 对 这 项 原因 的 评分 最 高 ,均值 为 4. 30。 假 如 制造 
厂 乙 的 研究 人 员 认 为 该 厂 管 理 者 不 会 给 出 如 此 高 的 评分 ,为 了 证 明 其 理论 ,他 们 进 
行 了 一 次 假设 检验 。 检 验 水 平 设 为 0. 05, 收 集 数据 ,得 到 了 以 下 结果 
3455458524444 
44445444344 
435445444 5 
利用 这 些 数据 和 假设 检验 方法 , 乙 管理 者 对 这 项 原因 的 评分 是 否 显著 低 于 在 
甲 得 到 的 均值 4. 307 
解 ”建立 假设 Ho py=4.30, H, : 474.30 


选取 检验 统计 量 、Z= 各 
Ja 

检验 水 平 a=0. 05 z,—1.645 

拒绝 域 W — (2 — 1.645) 


检验 统计 量 取 值 ”< 一 -1365430 一 一 1.42 


因为 一 1. 427» — 1. 645, 故 不 能 拒绝 原 假设 。 即 检验 产生 的 数据 并 不 足以 表明 : 
客户 服务 作为 一 种 留 住 顾客 的 方式 ,在 乙 眼 中 的 重要 性 要 低 于 它 在 甲 管理 者 眼中 的 
重要 性 。 对 管理 者 来 说 ,客户 服务 在 甲 . 乙 两 厂 都 是 一 种 留 住 顾 客 的 重要 手段 。 

使 用 概 值 法 ,检验 统计 量 的 观察 值 >= 一 1. 42, 当 原 假 设 为 真 时 ,取得 不 大 于 
一 1.42 的 = 值 的 概率 为 0.0778, 所 以 在 a=0. 05 水 平 下 ,不 能 拒绝 原 假设 。 

此 问题 的 样本 容量 大 于 30, 使 用 样本 标准 差 0. 574 代替 总 体 标准 差 ,我 们 使 
用 = 检验 而 不 用 了 检验 。 


2. 方差 的 检验 


与 单 正 态 总 体 均值 的 检验 相 比 , 方差 的 检验 在 应 用 上 较 少 一 些 , 但 也 有 一 些 
应 用 。 比 如 , 一 种 仪器 或 一 种 测定 方法 的 精度 ( 指 其 内 在 误差 , 不 是 指 由 于 没有 
调 准 而 产生 的 偏离 ) 是 否 达 到 某 种 界限 ， 当 一 种 产品 的 质量 问题 主要 在 于 波动 太 
大 时 ， 可 能 需要 检验 方差 。 

现 假定 总 体 X 一 NG, 60. Xi，X,，…，,X, 为 取 自 该 总 体 的 样本 , a? RA, p 
可 以 未 知 或 已 知 。 以 下 我 们 分 别 进行 介绍 。 

(1) x 未知 的 情况 

建立 假设 H —d. Hio oi (gi 为 已 知 常数 )， 考虑 统计 量 x = 
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ODS, gu S 为 样本 方差 , E o WERE. M H iot 成 立时 ， 


x - C poop. TAPER a 由 
2 一 1)S: 
PGlg4G-D« a-us 
可 知 H, =o? 的 拒绝 条 件 为 
<in- DR >a D 
上 述 检验 法 应 用 了 服从 x 分 布 的 检验 统计 量 ,姑且 称 为 x 检验 法 。 
对 于 单 侧 假设 


<Å) =la 


H’, <é, H’, P> 


yk Koo =P, ur, s c A OS 
Y xXo-D 


类 似 地 ， 对 于 单 侧 假设 
H”, : P>, H", : o <o 
拒绝 H’ : o^ ot 的 条 件 为 
X Xml) 

例 6.2.3 在 正常 的 生产 条 件 下 , 某 产品 的 测试 指标 总 体 N~ NC os oi), 其 
中 四 =0.23。 后 来 改变 了 生产 工艺 , 出 了 新 产品 , 假设 新 产品 的 测试 指标 总 体 仍 
HX, BA X—NGe 0)。 从 新 产品 中 随机 地 抽取 10 件 , 测 得 样本 值 为 n. 
Xz，"…，xw 计 算得 到 样本 标准 差 S—0. 33。 试 在 检验 水 平 a 二 0.05 的 情况 下 检 
e: Jr26 o! 有 没有 显著 变化 ? @ 方差 o 是否 变 大 ? 

解 ”这 是 单 正 态 总 体 在 总 体 均值 y 未 知 的 情况 下 , 方差 的 统计 检验 问题 。 
四 是 双 侧 检验 ，@ 是 单 侧 检验 。 

四 建立 假设 用 。: o —o;—0.23'. Hi 1 o^ ol 

Hs : o! —oi 的 拒绝 条 件 为 

X Xi aO70 或 x 六 (一 DD 

(0—DS' _ 0—1) X0. 33? 

o 0. 23? 

Xii QO17 D =z ons (9)=2.70 

而 2. 70<18. 5274<19. 02， 所 以 不 能 拒绝 H, : =o; =0. 23*， 即 新 产品 指标 的 
方差 与 正常 情况 下 产品 指标 的 方差 比较 没有 显著 变化 。 

© 建立 假设 H's t o «oi —0.23* , H’, t ooi 

因为 y; O1— D — yi, (9) —IDF. CHISQCO. 95, 9) —16.92, 此 时 y? 检验 统计 





Wo y- —18.5274, y4 (n1 =x} os (9) 19.02, 
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量 值 仍 为 18. 5274, 又 18. 52747716. 92， 所 以 要 拒绝 H's : o^ oi —0. 23, 而 不 
拒绝 H^ >o, 说明 新 产品 指标 的 方差 比 正常 情况 下 产品 指标 的 方差 显著 地 
变 大 。 

注 KAROD, © 两 种 情况 下 的 结论 好 像 是 矛盾 的 :中 说 没有 显著 的 变 
化 ,@ 中 说 显著 地 变 大 。 这 是 为 什么 呢 ? 这 是 因为 任何 一 个 统计 检验 都 是 在 一 定 
的 检验 水 平 a 下 进行 的 , 对 同一 个 a. 不 同 的 假设 有 着 不 同 的 拒绝 条 件 ( 或 不 拒绝 
条 件 )。 由 于 @、@@ 是 不 同 的 假设 检验 问题 , 拒绝 条 件 不 同 。 因 此 ,同一 个 入 值 ， 
不 满足 的 拒绝 条 件 却 满足 加 的 拒绝 条 件 , 也 就 没什么 奇怪 的 了 。 

(2) p 已 知 的 情形 

Hi =, Hio! ois Hoto, H>; H't 20, H" <o 

所 有 概念 上 的 讨论 与 前 一 段 没 有 本 质 差异 , 选用 检验 统计 量 为 


Yu 
=f 
a o 


T= at 
当 Hs +0 — o RA t 1 À— — y! G0 e KTA h (CL E 


oo 
绝 条 件 。 下 面 小 结 如 下 。 
R628 单 正 态 总 体 方差 检验 表 


2 


x 

















已 知 时 
未 知 时 d 
kakia 检验 统计 量 
H, H, = P -a 
E 好 一 Er 
GRO i 
G 检验 ) 
在 显著 性 水 平 下 拒绝 Ho 的 条 件 
" " Y XX £QO-DX X xi. MR 
A m Mis l>a 30 
LE] Lor X^xo-D xx0 
PE <o Ex. o-D xx. o 
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练习 6.2 


LEX, X e X, 为 取 自 总 体 N Go oO 的 样本 , SA p d 均 未 知 , 且 
X- LYx.Q- 3jO,-X*. RB H :六 一 0 的 一 检验 , 使 用 的 统计 重 


T= » 
2. 设 某 厂 生产 的 一 种 钢 索 ,其 断裂 强度 X 千克 /平方 厘米 服从 正 态 分 布 
Neu. 40:)。 从 中 选取 一 个 容量 为 9 的 样本 , (X — 780 千克 /平方 厘米 。 能 否 据 
此 认为 这 批 钢 索 的 断裂 强度 为 800 千克 /平方 厘米 (e 一 0. 05) 。 
3. 食品 厂 用 自动 装 铅 机 装 锡 头 食品 , 每 铅 标 准 重 量 为 500 克 , 每 隔 一 定时 间 
需要 检验 机 器 的 工作 情况 , 现 抽 10 E. 测 得 其 重量 (单位 : 克 ) 
495. 510, 505, 498, 503. 492. 502, 512, 497, 506 
假设 重量 X 服从 正 态 分 布 N(P o), 试问 机 器 工作 是 否 正常 (< 一 0.02)? 
4. 某 厂 对 废水 进行 处 理 , 要 求 某 种 有 害 物质 的 浓度 不 超过 19 毫克 / 立 升 , 抽 
样 检测 得 到 10 个 数据 ,其 样本 均值 又 = 19. 5 毫克 / 立 升 , 样本 方差 S! 一 1. 25 
CAE SE/ TIO. Fel YE Sb WHEKE a=0. 05 下 能 认为 处 理 后 的 废水 符合 标准 吗 ? 
5. 用 过 去 的 铸造 方法 , 零件 强度 服从 正 态 分 布 , 其 标准 差 为 1. 6 千克 /平方 
毫米 。 为 了 降低 成 本 , 改变 了 铸造 方法 ， 测 得 用 新 方法 铸 出 零件 强度 如 下 : 
51.9, 53.0, 52. 7, 54.1, 53.2, 52.3, 52.5, 51. 1, 54.7 
间 改 变 方法 后 零件 强度 的 方差 是 否 发 生 了 显著 变化 ( 取 显 著 性 水 平 a 二 0.05)? 
6. 用 包装 机 包装 某 种 洗衣 粉 , 在 正常 情况 下 ,每 袋 重量 为 1000 克 , 标准 差 
不 能 超过 15 克 。 假 设 每 袋 洗衣 粉 的 重量 服从 正 态 分 布 。 某 天 检验 机 器 工作 的 情 
Bb. 从 已 装 好 的 袋 中 随机 抽取 10 袋 , 测 得 其 重量 (单位 : 克 ) 为 
1020, 1030, 968, 994, 1014, 998, 976. 982. 950, 1048 
问 这 天 机 器 是 否 工 作 正常 (ea 一 0.05)? 
7. 利用 已 给 出 的 数据 检验 下 面 的 假设 ,并 求 概 值 p 
(OD Hs :p=25 vs H, p#25 
228.1. n=57, s=8. 46, a=0.01 
(2) Hs : p=7.48 vs H, :p<7.48 
276.91. n=96, s—1.21. a=0.01 
(3) Hs : p=1200 vs H, * p>1200 
z=1215, n=113, s=100, a=0. 01 
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8. 某 城市 用 水 工程 学 会 估计 ,在 该 城市 每 户 每 天 的 平均 用 水 量 为 123( 单 位 )， 
假设 有 些 研究 人 员 认 为 现在 用 水 量 增加 了 .并 想 通 过 检验 确定 是 否 确实 如 此 。 他 
们 抽取 了 该 城市 一 些 居 民 作为 样本 ,并 细致 地 记录 下 某 一 天 中 每 个 样本 成 员 用 掉 
的 水 ,然后 使 用 一 种 统计 软件 包 进行 了 分 析 , 结 果 如 下 。 


One 一 Sample Statistics 








变量 N Mean Std. Deviation | Std. Error Mean 





4.38 





用 水 量 40 132. 36 | 27. 68 





One-Sample Test 











Test of p= 123 vs 175123 
变量 
z Sig. (2-tailed) 95% Lower Bound 
用 水 量 2.14 0.032 125.16 











假定 检验 水 平 为 0. 05, 样 本 容量 是 多 少 ? 样本 均值 与 样本 标准 差 是 多 少 ? 是 
单 侧 检验 还 是 双 侧 检验 ? 研究 结果 是 什么 ? 根据 结果 ,可 以 对 原 假设 作出 什么 样 
的 判断 ? 


6.3 双 正 态 总 体 的 统计 检验 及 SPSS 实现 


1. 双 总 体 均值 之 差 的 检验 
设 总 体 X 一 NG ,of), 总 体 Y 一 NG h), À X—N(Ga oi) 中 抽取 样本 
Xi XX 人 Y 一 N(pw，, 怠 ) 中 抽取 样本 Y,,Y,,…,Y,,， 且 假定 两 样本 
间 相 互 独立 。 
给 定常 数 jo， 所 要 考虑 的 统计 假设 有 
Ho * qn — p = ms Hy n — pa E po 
H's: mp Km» H' n — p > po 
H’, t m — p >p» Hmm 
常见 的 情况 是 yo 二 0， 对 于 总 体 方差 oio. 我 们 依 下 面 三 种 情况 分 别 进 
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(1) dí, ci, HEA 
选取 检验 统计 量 Z=, ， 当 n.i u us mus RER, ZNO, 1), 


mp onm 

于 是 对 给 定 的 显著 性 水 平 a， 

Hs :Am 一 pe = po 的 拒绝 条 件 为 : | Z1>> z; 

H's : jn — p S po 的 拒绝 条 件 为 : Z> z 

H^, :ma 一 pz >È p 的 拒绝 条 件 为 : Z 二 一 z 

例 6.3.1 从 两 个 教学 班 各 随机 选取 14 名 学 生 进行 数学 测验 , 第 一 教学 班 

与 第 二 教学 班 测验 结果 分 别 由 表 6. 3. 1 中 的 A 列 与 B 列 单元 格 所 示 , 已 知 两 教学 
班 数 学 成 绩 的 方差 分 别 为 57 53, 在 显著 性 水 平 0. 05 下 , 可 否认 为 这 两 个 教学 
班 学 生 的 数学 测验 成 绩 有 差异 ? 





n =m=n=l4, a—0.05, 
建立 假设 Ho : s — 0. H, : qn 7 i750 
x X-Y—- . 93—90. 29— 
检验 统计 量 2 2293,zs 一 zo.0 一 1.96, 因 
Oo $ ar 22 
An n l^ 


为 |0. 2293| —1. 96 ,不 满足 拒绝 Ho * mm 一 pw —0 的 条 件 , 故 不 拒绝 Ho : n 一 py =0, R 
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示 无 充分 证 据 显 示 两 个 教学 班 数学 成 绩 有 差异 。 


(2) oi, ci 均 未 知 , 但 oi == 


Yx—Yy— m 2 La 2 
选取 检验 统计 量 一 一 了 一 各 ,其 中 s; - C7 DSEE OL DSE 


s 1.1 n-nm-2 s Si» SE 
分 别 为 两 样本 的 样本 方差 。 当 Ho * pu 一 pz — po 成 立时 ,T~t(m 十 ns 一 2), 于 是 
对 给 定 的 显著 性 水 平 a， 

Hs : p — pz = pw 的 拒绝 条 件 为 : | T |> t$ On +m 一 2) 

H’,: 


qu 一 jz S po 的 拒绝 条 件 为 : T> tm 十 ns 一 2) 
H”, : jn 一 p: > po 的 拒绝 条 件 为 : T 29 On, +m 一 2) 
例 6.3.2 某 地 区 高 考 负责 人 想 知 道 能 不 能 说 某 年 来 自 城市 中 学 考生 的 平均 


成 绩 比 来 自 农村 中 学 考生 的 平均 成 绩 高 , 已 知 总 体 服从 正 态 分 布 且 方 差 大 致 相 
同 , 由 抽样 获得 资料 如 表 6. 3.2 中 人 A 列 和 B 列 。 


MO RBB: Htp 


17X0, Hi ! ui 7770. 

建立 SPSS 数据 文件 ( 表 6. 3. 3, 见 SPSS 数据 文件 例 6.3.2). 38 — 9] x 为 每 

个 考生 高 考 平均 成 绩 , 第 二 列 分 组 变量 g 中 “1" 代 表 城 市 考生 ,“2" 代 表 农 村 考生 。 
表 6.3.2 
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依次 调 出 双 正 态 总 体 独 立 样本 T 检验 程序 (如 图 6. 3. D. 
Yie» Deta Trustorn EIER StssAMüns Grephs Utilities Yindor Help 
IL EDSEPEee TEC 























Tables » 
x z^ D m 
850 T General Linear Model > One-Swple T Test 
750 1 Me Models , 
ü iU perdete , 
780 1 Regression » One-Way ANOVA. 
88.0 M| dere a 
anif 
E J Data Reduction. » 
3 Seale » 


图 6.3.1 


打开 对 话 框 (如 图 6. 3. 2) 。 点 击 Continue 一 OK, 即 得 到 输出 结果 ( 表 6. 3. 4 
MÆ 6.3.5), 














图 6.3.2 


表 6.3.4 Group Statistics 


Mean Std. Deviation Std. Error Mean 

















分 组 N 
高 考 成 绩 城市 10 85. 500 6.5532 2.0723 
农村 10 88. 900 6. 1183 1. 9348 
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表 6.3.5 Independent Samples Test 


一 一 


Levene' s Test 





for Equality of t-test for Equality of Means 
Variances 
Sig. Mean | Std. Error 
F Sig. t df 


(2-tailed) [Difference Difference 























高 |Equal variances 3 
.071 | .793 |-L19d 18 | .246 | —3.400| 2.8351 

A [assumed 

成 |Eaual variances 

绩 —1.19917.916| .246 |—3.400| 2.8351 

# not assumed 








因为 p— X0. 246—0. 1237-0. 05=a, BELLI TR Ho * pn — je 50, 表示 无 
充分 证 据 显示 来 自 城市 中 学 考生 的 平均 成 绩 比 来 自 农 村 中 学 考生 的 平均 成 绩 高 。 
(3) oi, oi 均 未 知 , 但 oio: 
选取 检验 统计 其 了 = 局 一 夭 ， 当 He s pa pem 成 立时 ,近似 服从 
mE 
mm 
ad 
LAP, JER df s m 
Am D iR- 
各 基本 假设 的 拒绝 条 件 。 
比如 ,已 知 某 市 南 区 与 北 区 近 12 个 月 降水 量 ,要 求 以 显著 性 水 平 0.01 检验 候 
设 : 南 区 雨量 不 超过 北 区 雨量 。 假 定 观测 值 均 取 自 正 态 总 体 ,但 其 方差 不 等 , 就 
是 这 样 的 例子 。 


2. 成 对 数据 比较 检验 法 


下 面 我 们 通过 三 个 实例 来 解释 本 段 要 讨论 的 主题 。 

实例 1 设 某 一 种 农作物 有 两 个 品种 A、B, 要 比较 谁 的 平均 亩 产量 大 , 按 前 
一 段 所 讨论 的 检验 两 个 正 态 总 体 均 值 之 差 的 方法 , 我 们 可 以 准备 十 nz 块 形 状 
面积 相同 的 地 块 ， 其 中 mi 块 种 植 品种 A, 得 亩 产量 Xi. Xon. X. on 块 种 
植 品种 B, Rri Yi, Yos ees Yno 然后 按 上 段 检验 法 去 处 理 。 这 样 做 有 一 个 
前 提 , 就 是 这 mtn 个 地 块 的 条 件 必须 比较 一 致 。 不 然 的 话 , 假如 分 配给 品种 A 


y 





， 于 是 对 给 定 的 显著 性 水 平 a, 不 难 写 出 
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的 那 m 块 地 比较 肥沃 ,或 其 它 条件 较 好 ,， 则 即使 A 品种 并 不 优 于 B. 试验 结果 也 
可 能 有 利于 它 。 改 进 的 方法 是 取 对 地 块 ， 每 对 包含 两 个 形状 条 件 一 致 的 地 块 ， 
其 中 一 块 种 植 A, 另 一 块 种 植 B ( 哪 一 块 给 A 可 随机 决定 )。 这 样 设计 时 , 哪 一 个 
品种 也 不 会 占 地 利之 便 , 不 同 对 的 地 块 条 件 不 必 一 致 ， 因 而 较 容易 办 到 。 

实例 2 ”为 治疗 某 种 疾病 ,以 往 用 一 种 药品 A, 现 新 研制 出 一 种 药品 B。 为 
比较 ALB 的 效果 , RI DURO Hn 个 患者 , nm 个 用 A, n 个 用 B。 但 这 样 做 又 有 与 
实例 1 相似 的 问题 : 患者 的 情况 不 一 , 有 的 病情 已 重 , 一般 身体 条 件 差 , 用 药 难 
以 见效 , 有 的 患者 则 条 件 好 些 。 为 了 避免 这 种 误差 ,我 们 可 以 取 n 对 患者 , 每 对 
的 两 名 患者 在 条 件 上 尽 可 能 一 致 , 其 中 一 名 用 A, 另 一 名 用 B, 不 同 对 患者 条 件 
不 必 一 致 。 这 样 做 避免 了 上 述 误 差 , 在 设计 上 也 不 难 实现 。 因 为 这 里 只 要 求 每 对 
的 两 名 患者 条 件 一 致 ， 而 不 要 求全 体 参 试 的 患者 都 一 致 

实例 3 ”为 比较 每 天 在 固定 时 间 上 八 小 时 班 和 让 工作 者 自己 选择 八 小 时 工作 
时 间 这 两 种 方式 哪 一 种 更 有 效 ( 能 完成 更 多 的 工作 量 )。 可 以 挑选 mm +H 个 工作 
者 作 试 验 , 其 中 m 个 采用 第 一 种 方式 , 余下 的 m 个 采用 第 二 种 方式 。 但 这 样 做 
义 有 一 个 由 于 这 十 nz 个 工作 者 工作 能 力 高 低 不 同 而 带 来 的 误差 问题 。 为 克服 
X ， 我 们 采取 成 对 比较 法 ,选择 n DE dE. 每 对 包含 条 件 尽 可 能 接近 的 两 
f， 这 种 试验 设计 ( 即 成 对 设计 ) 就 避免 了 上 述 误差 。 
上 诸 例 的 思想 , 我 们 就 可 以 提出 以 下 的 一 般 模型 : 设 有 两 个 需要 进行 比 
较 的 处 理 ,“ 处 理 " 一 词 的 含义 在 此 很 广泛 , 如 在 实例 1 中 , 每 个 品种 是 一 个 处 理 ; 在 
实例 2 中 , 每 种 药物 是 一 个 处 理 ; 在 实例 3 中 , 每 种 工作 方式 是 一 个 处 理 , 等 等 。 选 
PE tie foc". 每 对 中 的 两 个 试验 单元 条 件 尽 可 能 一 致 ， 而 不 同 对 之 间 则 不 要 
求 一 致 , 在 每 一 对 内 , 随机 地 决定 把 其 中 的 一 个 试验 单元 给 处 理 1,， 另 一 个 给 处 理 
2, 经 过 试验 , 观测 各 处 理 在 每 个 试验 单元 上 的 试验 结果 , 如 下 表 6. 3. 6。 












表 6.3.6 
T 
对 处 理 1 处 理 2 差 Zi 一 X, 一 多 
1 X Y, Z -X -Y 
2 X, Y. 2Z,7X,—-Y, 
n X, Y, 2, - X. —Y, 





这 里 的 Z, — X, Yi, i 二 1, 2, t n 就 是 在 第 i 对 试验 单元 中 , 所 观测 到 的 处 
理 1 优 于 处 理 2 的 量 (为 确定 计 , 我 们 假定 观测 值 愈 大 愈 优 ) 。 这 个 量 不 是 由 于 试 
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验 条 件 上 的 差别 而 来 , 因为 每 对 内 两 个 试验 单元 条 件 已 尽量 一 致 了 。 我 们 假定 
Z,— X, —Y. WU IE S 4f N Gas o), 而 py 就 表示 处 理 1 平均 优 于 处 理 2 的 量 。 这 
样 一 来 , 两 种 处 理 的 比较 就 归结 为 对 y 的 检验 问题 , 例如: 

(D 两 种 处 理 效果 一 样 ,p 一 0; 

@ 处 理 2 不 优 于 处 理 1, y> 0; 

图 处 理 2 不 劣 于 处 理 1, y< 0; 

CD 处 理 1 平均 优 于 处 理 2 的 量 为 po， n pos 

C) 处 理 1 平均 优 于 处 理 2 的 量 不 超过 je， n pos 

© 处 理 1 平均 优 于 处 理 2 的 量 不 小 于 s pj 之 po 
等 等 。 因 此 , 问题 回 到 我 们 已 讨论 过 的 单 正 态 总 体 的 均值 的 检验 。 

Zis Zi t Z, 可 视 为 取 自 正 态 总 体 N (jp, a) 的 样本 ,所 以 , 我 们 可 选取 检 
验 统计 量 


Zo 
TUS 
n 
JtUbZ —-X-Y, S=; HLZ- 当 Ho t p= p 成 立时 , T — tin), 


对 给 定 的 显著 性 水 平 a， 
Ho。: p = pw 的 拒绝 条 件 为 : | TT | 二 t4(n 一 1) 
H’, + p< ps 的 拒绝 条 件 为 : T> OL D 
H',: p> p 的 拒绝 条 件 为 : TT 一 一 1,(n 一 1) 
例 6.3.3 为 了 解 两 种 教学 法 对 9 名 学 生 试 验 的 结果 , 经 试验 后 , 测 得 成 绩 
如 表 6.3.7 的 A JI B 列 。 假 定 总 体 为 正 态 , 以 0. 05 为 显著 性 水 平 , 检验 此 两 
种 教学 法 效果 是 否 不 同 ? 


表 6.3.7 
EOAR En EES E 
3 方法 A AEB 
2j 327.6 327.6 
327.7. 327.7 
327.7 321.6 
j 327.9 32.8 
321.4 321.4 
Hep 327.7 3256 
WB 327.8 327.8 
9 327.8 — 327.7 





10| 327.4 327.3 
解 ” 检 验 原 假设 Ho: y= p =0, 使 用 SPSS 解 成 对 观测 值 : 检验 方法 如 下 : 
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建立 SPSS 数据 文件 ( 表 6. 3. 8, 见 SPSS 数据 文件 例 6. 3. 3) 。 


表 6.3.8 





调用 分 析 程序 ,依次 点 击 (如 图 6. 3.3) 。 


Trastorn [MBEE ss， so dites Fintor dep 








Reports FY 
Droriptive statisties > DIQ) 
Tables » 
D oue 
>  One-Seaple T Test 
, 
, 
3278 — Pene , 
pra — lade , 
HH 6.3.3 


弹出 对 话 框 并 填写 相应 选项 (图 6. 3. 4) 。 






[SFA 
EETA ně 一 
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点 击 Continue OK , BI fS $48 H £5 JR CR 6. 3. 9 一 表 6. 3. 11) 。 


表 6.3.9 Paired Samples Statistics 

































| Mean N Sid. Deviation Std. Error Mean 
Pair 1 方法 A | 327.667 9 .1732 .0577 
方法 B 327611 9 .1691 .0564 
表 6.3.10 Paired Samples Correlations 
N Correlation Sig. 








Pair 1 


方法 A& 方法 B 





.953 





表 6.3.11 Paired Samples Test 


Paired Differences 











95% Confidence 
Sig. 
Sid. — |Std. Error| Interval of the 
Mean (2-tailed) 
Deviation| Mean | Difference 
Lower | Upper 
方法 A 
Pair 1 056 .0527 | .0176 .015 .096 .013 
方法 B 























因为 p 二 0.013 二 0.05 二 a, 故 拒绝 原 假设 , 而 得 出 此 两 种 教学 法 效果 不 同 的 结 
i£. 或 1 值 为 3.16227766, 自由 度 为 8, 分 位 数 为 2. 306005626, 因 3. 16227766 
2. 306005626, 故 拒绝 原 假设 , 而 得 出 此 两 种 教学 法 效果 不 同 的 结论 。 


3. 双 总 体 方差 之 比 的 检验 


设 总 体 X 一 NGn å), E YNGa o0. A X—NGa ca) 中 抽取 样本 


Xi Xon Xn o A Yo NGe s oO Bl Yos Yos onn. 


间 相 互 独立 。 


在 第 4 章 中 , 我 们 已 经 知道 





— Fin —1,n —1), 
zi 


Y,。， 且 假定 两 样本 
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A 
EMO. D? 

e 
15y- 


oim 


下 面 我 们 讨论 双 正 态 总 体 方差 齐 性 的 检验 。 
提出 统计 假设 


E 
A 


cC bis nj) 


Ho -uHiW gi 
Hui ei Hui 
H's >i, Hi el 
o 
(1) pi, p 均 未 知 
4 H, : $2 成 立时 ,检验 统计 量 是 F-Si- Fa, - 1, mz 一 1), 对 给 定 的 
显著 性 水 平 a. 由 于 PC, 4ml, n m D&F&F, i —1, m-1)=1-a, 所 
2 
以 , Ho: S) 的 拒绝 条 件 为 


F<Fi-4(m—1, m —D 或 F>F;(m—1, m—D 


注 ”一 般 选 较 大 的 样本 方差 做 检验 统计 量 的 分 子 , 因而 也 仅 需 要 查分 位 数 
Fi (nm 一 1, ns 一 1) 即 可 得 出 结果 。 


类 似 可 得 
Hui e 1 的 拒绝 条 件 为 : Fo» F,(m 一 1, ns 一 1) 
H', «2e 1 的 拒绝 条 件 为 ， Fe FG —1,8—1) 
E: 


注意 到 公式 Fi- (ml, m —D— 





F, (m 3 元 二 1 有 时 是 有 用 的 。 
(2) m, pz 均 已 知 


Exu 
"HS CLR. Hegt F = oE m), REROR 


2e. 一 各) 
似 于 上 段 , 对 给 定 的 显著 性 水 平 a, 易 写 出 


? ~ ~ 
Ho :全 一 1 的 拒绝 条 件 为 : FF, (m,n) R ESF (m, m) 
d 
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类 似 可 得 


H', É < 1 BRA HO Fo» F On, m) 


H’, 5 > 1 的 拒绝 条 件 为 : < Fom, m) 
i 


注意 到 公式 FO, n) m pec 7 有 时 是 有 用 的 。 


练习 6.3 


1. 某 化 工厂 为 了 提高 某 种 化 学 药品 的 得 率 , 提出 了 两 种 工艺 方案 。 为 了 研 
究 哪 一 种 方案 好 , 分别 用 两 种 工艺 各 进行 了 10 次 试验 , 数据 如 下 
方案 甲 得 率 (%): 68.1, 62.4, 64.3, 64.7, 68.4, 66.0, 65.5, 66.7, 67.3, 
66.2 
方案 乙 得 率 (%): 69.1, 71.0, 69.1, 70.0, 69. 1, 69.1, 67.3, 70.2, 72.1, 
67.3 
假设 得 率 服从 正 态 分 布 ， 问 方案 乙 是 否 能 比方 案 甲 显著 提高 得 率 ( 取 a —0. 01)? 
2. 用 两 种 方法 研究 冰 的 潜 热 , 样本 都 取 自 一 0.72 Chk. MIE A 做 , 取 
样本 容量 m — 13, 用 方法 B 做, 取样 本 容量 n. — 8, 测 得 每 克 冰 从 一 0. 72 CER 
0 的 水 , 其 中 热量 的 变化 数据 为 
方法 A: 79.98, 80.04, 80.02, 80. 04, 80. 03, 80. 04, 80.03, 79.97, 80.05, 
80. 03, 80. 02, 80. 00, 80.02; 
方法 B: 80.02, 79.94, 79. 97, 79. 98, 79. 97, 80.03, 79.95, 79.97. 
假设 两 种 方法 测 得 数据 总 体 都 服从 正 态 分 布 , 试问 : 
(1) 两 种 方法 测量 总 体 的 方差 是 否 相 等 (a 二 0.05)? 
(2) 两 种 方法 测量 总 体 的 均值 是 否 相等 (a 二 0.05)? 
3. 9 名 运动 员 在 初 进 运 动 队 时 和 接受 一 周 训练 后 各 进行 一 次 体能 测试 , 测试 
评分 为 
运动 员 1 2 3 4 5 6 7 8 9 
入 队 时 76 71 57 49 70 69 26 65 59 
训练 后 81 85 52 52 70 63 33 83 62 














假设 分 数 服 从 正 态 分 布 , 试 在 显著 性 水 平 a — 0.05 F, 判断 运动 员 体能 训练 效果 
是 否 显著 ? 
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6.4 两 个 需要 说 明 的 问题 


1. 统计 检验 与 区 间 估 计 的 关系 

统计 检验 和 区 间 估 计 是 两 种 最 重要 的 统计 推断 形式 , 这 两 者 初 看 好 像 完全 不 
同 , 其 实 两 者 之 间 有 一 定 的 联系 。 然 而 , 其 结果 的 解释 上 也 有 差别 。 下 面 我 们 只 
就 一 个 例子 来 加 以 说 明 。 

(1) 利用 统计 检验 可 建立 区 间 估 计 ， 反之 亦 然 

以 正 态 分 布 期 望 值 的 检验 和 区 间 估 计 问题 为 例 。 设 X,，X;，…,，X, 为 取 自 
ESME N Qu DWEK, 方差 RA, 要 检验 H p=, Hi pps. 我 们 
知道 ,对 给 定 的 检验 水 平 a， AT, Ho i um js ERR A IOS | | 
^ 


Sus On — 1), 将 这 个 不 拒绝 条 件 改写 成 








t O- D^ RIA e Hos | e 
E 
S z, S , — -— 
Xin DEwsX Y og QD, 再 把 rm 改 成 po 便 可 得 到 py 的 置信 度 为 
1 一 a 的 置信 区 间 。 
Rz. 若 我 们 先 确定 了 六 的 区 间 估 计 Xs QI Dg. X praz, 


WIE pu BOR pos 这 样 就 得 到 了 原 假 设 H，: n ns 的 不 拒绝 条 件 ， 也 就 得 到 了 
Ho * py 二 pw 的 拒绝 条 件 , 检验 水 平 为 a。 

这 个 对 应 关系 在 其 它 问题 中 也 存在 。 作 为 练习 ,建议 考虑 在 方差 相等 (但 未 
知 ) 的 条 件 下 , 两 正 态 总 体 均值 之 差 的 统计 检验 和 区 间 估 计 的 问题 。 


(2) 统计 检验 和 区 间 估 计 的 结果 , 在 解释 上 可 以 有 差别 

仍 就 上 例 来 说 明 。 在 有 了 样本 之 后 , 我 们 同时 检验 假设 Ho: y=p = 0( 水 
F 200 KE p 的 区 间 估 计 ( 和 置信 度 为 1 一 a)。 对 不 同 的 样本 值 , 以 下 几 种 情况 都 可 能 
出 现 : 

(D 不 拒绝 H, * py 二 jw 二 0. 区 间 估 计 为 (一 0.001. 0.002); © 不 拒绝  : y= 
m= 0, 区间 估 计 为 (一 1000, 1500); © 拒绝 H, : jy 二 pw 二 0, 区 间 估 计 为 (1000， 
2000); @ 拒绝 H, : y==jp = 0. 区 间 估 计 为 (0.001. 0.002), 

情况 , 按 统计 检验 , 应 不 拒绝 H。: pw 一 各 一 0. 按 区 间 估 计 , 六 能 取 的 最 大 
值 和 最 小 值 都 很 接近 0, 这 两 者 的 解释 一 致 。 
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情况 @, 按 统计 检验 , 应 不 拒绝 H py 二 jw 0, 按 区 间 估 计 , 这 区 间 包 含 
0, 即 0 是 py 的 一 个 可 能 值 , 在 这 一 点 上 与 统计 检验 的 结论 一 致 。 但 细 看 这 一 区 
f]. 最 大 可 以 到 1500. 最 小 可 到 一 1000, 这 中 间 哪 一 个 值 都 可 能 。 因此 ,从 区 间 
估计 的 角度 看 , 实在 没有 多 大 把 握 认为 u 能 在 0 附近 , 这 就 与 统计 检验 给 的 结论 
不 大 协调 了 。 

WAO, 按 统计 检验 , 应 拒绝 H * /一 0, 按 区 间 估 计 , 这 区 间 不 包含 0, 即 0 
不 看 作 p 的 可 能 值 , 而 且 , 区 间 的 最 小 值 也 有 1000, 与 0 相距 甚 远 。 故 认为 y 关 0 
很 有 理由 (区 间 估 计 的 结论 加 强 了 统计 检验 的 结论 ) 。 

情况 @, 按 统计 检验 , 应 拒绝 H。: pw 一 和 一 0. 按 区 间 估 计 ,， 这 区 间 不 包含 
0,， 从 这 方面 看 两 者 一 致 。 可 是 细 看 这 区 间 ， 就 发 现 它 整 个 在 0 附近 。 因 此 ,实质 
上 可 以 认为 4 就 是 0, 这 样 区 间 估 计 的 结论 (在 实质 上 ) 就 与 统计 检验 的 结论 不 同 。 

由 此 例 也 看 到 , 统计 上 的 结论 一 定 要 注意 其 实质 含义 , 如 只 停留 在 表面 上 ， 
就 有 可 能 被 引入 歧途 。 


2. 检验 的 p 值 


统计 检验 的 可 能 结论 只 有 两 个 : 不 拒绝 或 拒绝 。 作 出 这 一 或 那 一 结论 的 根据 
有 多 大 , 则 往往 不 能 清楚 地 显示 出 来 。 比 如 ,， 某 市 的 工业 主管 部 门 想 判定 A.B 
两 厂 的 产品 质量 谁 优 谁 劣 , 他 委托 一 个 统计 学 家 进行 一 个 统计 检验 H。: “A 不 
优 于 B”"， 当 他 被 告知 这 假设 应 不 被 拒绝 时 , 他 只 知道 作出 的 结论 是 Ho “A 不 
优 于 B", 但 作出 这 一 结论 的 根据 有 多 大 ? 他 不 可 能 有 一 个 数量 的 概念 。 这 是 统计 
检验 这 种 统计 推断 形式 的 一 个 缺点 。 在 上 一 段 , 我 们 曾 将 统计 检验 和 区 间 估计 做 
了 一 个 对 比 ,并 指出 : 一 般 说 来 , 用 统计 检验 作出 的 结论 , 不 如 区 间 估 计 那 么 精 
细 。 这 一 点 的 根 由 就 在 于 统计 检验 这 种 形式 固有 的 粗糙 性 。 但 是 ， 对 这 些 情 况 可 
以 作 补 救 , 方法 是 引进 下 面 要 介绍 的 “p 值 ”。 

设想 一 个 简单 的 检验 问题 : 在 正 态 总 体 N 1) 中 抽取 样本 Xs X es 
Xis， 要 检验 假设 H。: py 二 0, H, : p#0, 取 检 验 水 平 0.05, 拒绝 H。: py 二 0 的 条 
件 为 |X| 二 0.49。 假 设 对 一 组 具体 的 Xi. Xas on. Xis Hi X—0.48, 这 时 我 们 应 不 
拒绝 Hs : py 二 0。 又 假设 另 一 组 具体 的 六 ,， Xos nn. Xo X—0.12, 则 当然 也 不 
拒绝 H。: py 二 0。 对 这 两 组 样本 而 言 , 结论 一 致 (都 是 不 拒绝 H,: /一 0)。 然 而 ， 
我 们 会 觉得 , 在 后 一 种 场合 , 作出 a0 的 结论 根据 大 一 些 ; 而 在 前 一 场合 , 此 根 
据 则 小 一 些 。 为 了 反映 这 一 点 , 我 们 引进 p 值 。 其 定义 如 下 。 

设 对 某 一 组 具体 样本 , 计算 出 X — 5. 则 这 组 样本 的 p 值 定义 为 

p=P(|ZI>416|), Z~N(0, D 
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解释 如 下 : 我 们 已 经 实际 观测 到 X 的 一 个 值 6， 它 与 假设 值 x 一 0 有 偏差 151, 我 
们 问 达到 这 么 大 或 更 大 的 偏离 的 机 会 有 多 大 ? 这 就 是 上 式 定义 的 p. d p 很 大 ， 
说 明 在 原 假设 w=0 之 下 , 得 到 这 么 大 偏差 很 平常 , 不 值得 奇怪 ， 因 而 认为 w 一 0 
的 根据 较 充分 。 反 之 , 若 p 很 小 , 则 在 jy 二 0 之 下 得 到 这 么 大 一 个 偏差 很 难得 , 这 
很 有 可 能 意味 着 y 了 0。 因 此， 当 p 很 小 时 , 认为 n0 的 根据 就 很 不 够 。 总 之 , p 
AKOM, 认为 ==0 的 根据 就 愈 足 (不 足 )， 当 p 值 落 到 给 定 的 水 平 a 之 下 时 ,就 
要 拒绝 jy 二 0 了。 车 pa, 但 离 a 很 近 , 则 我 们 虽 不 能 拒绝 y 二 0, 但 对 它 抱 着 很 
怀疑 的 态度 。 

比如 ,用 前 面 的 举例 来 说 , 两 组 样本 的 p 值 分 别 为 

p=P(|Z|>1.92)=0.0548, p=P(|Z|>0.48)=0. 6312 
前 一 种 情况 , 户 值 离 检验 水 平 <= 0.05 (RE. 虽 不 能 拒绝 y= 二 0, 但 是 值得 怀疑 。 
后 一 种 情况 ,出现 像 0. 12 或 更 大 偏差 的 可 能 性 在 10 下 为 0.6312, 这 一 可 能 性 
很 大 , 不 足 为 奇 。 

以 上 分 析 很 自然 地 推广 到 一 般 情况 : 设 有 一 个 原 假设 Hos 其 拒绝 条 件 为 
IC, 1 为 检验 统计 量 。 若 对 一 组 具体 样本 计算 出 统计 量 : 之 值 为 wb, 则 这 组 样本 
W p (Je p— PCI | || HO» 如 果 拒 绝 条 件 为 :>C, 则 p 值 为 p=P(i>4w|H,)， 
如 果 拒 绝 条 件 为 :<C, 则 p 值 为 p— Pan HO. 

例 6.4.1 从 电话 公司 每 月 长 途 电 话 的 账单 中 , 随机 抽取 37 张 , 计算 平均 费 
用 为 33.15 元 ， 标准 差 为 21. 21 元 。 假 定 费用 服从 正 态 分 布 Nu, °), o! RA, 
要 检验 假设 Ho * 430, H, : p#30, 试 计算 p 值 。 


M 因为 检验 统计 量 为 :一 < 各, 在 uium 下 4 一 < 的 服 从 分 布 


n Ja 
101 D, 依 样本 计算 检验 统计 量 1 A Se O o — 35219300, oo, 所 以 
Yu J37 


p =P(ltl> ltl |H) =P(t|>0. 90| Ho) 
—1— P(—0. 90«i«0. 90 | H) 
=1—[CDF. T(0. 90, 37—1) — CDF. T(—0. 90, 37—1)] 
=1—[0.81—0. 19]=0. 38 

说 明 样本 支持 原 假设 , 故 不 拒绝 原 假设 。 
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在 现实 的 生产 和 经 营 管理 中 ,经 常 要 分 析 各 种 因素 对 研究 对 象 某 些 特征 值 的 
影响 。 比 如 ,在 工业 生产 中 往往 要 考察 几 种 不 同 原料 对 产品 质量 有 否 明 显影 响 ; 在 
农业 生产 中 往往 要 考察 不 同 品种 .肥料 种 类 、 施 肥 量 等 对 某 种 作物 亩 产量 的 影响 ; 
在 化 学 实验 中 往往 要 分 析 反 应 温度 、 反 应 时 间 、 原 料 成 分 .原料 用 量 等 对 某 种 物质 
得 率 的 影响 ,在 市 场 营销 中 往往 要 分 析 不 同 地 区 、 不 同时 期 对 某 种 产品 销量 的 影 
响 ,等 等 。 在 影响 特征 值 的 众多 因素 中 ,常常 需要 分 析 哪 几 种 因素 对 生产 和 销量 起 
显著 作用 ,并 需 知道 起 显著 作用 的 因素 在 何 时 起 最 好 的 影响 作用 。 为 此 ,就 必须 让 
这 些 因素 改变 各 种 不 同 状态 进行 试验 和 观察 ,并 对 试验 结果 一 一 数据 进行 科学 的 
分 析 。 方 差分 析 就 是 采用 数理 统计 方法 对 数据 进行 分 析 , 以 鉴别 各 种 因素 对 研究 
对 象 的 某 些 特征 值 影响 大 小 的 一 种 有 效 方法 。 

方差 分 析 是 英国 大 统计 学 家 费 软 尔 (Fisher) 在 20 世纪 20 年 代 创立 的 , 那 时 
他 在 英国 一 个 农业 试验 站 工作 ,需要 进行 许多 田间 试验 ,为 分 析 这 种 试验 的 结果 ， 
他 发 明了 方差 分 析 法 ,之 后 此 方法 被 用 于 其 它 许多 领域 ,都 取得 了 很 大 的 成 功 。 


7.1 方差 分 析 的 基本 思想 


为 方便 起 见 , 今 后 我 们 把 研究 对 象 的 特征 值 , 即 所 考察 的 试验 (其 涵义 包括 调 
查 , 收 集 等 ) 结 果 ( 如 产品 质量 ,数量 ,销量 ,成 本 等 ) 称 为 试验 指标 ,简称 指标 ,常用 
工 表示 。 由 于 试验 误差 的 存在 , 故 “ 指 标 ” 为 随机 变量 。 在 试验 中 对 所 关心 的 “ 指 
标 " 有 影响 的 、 要 加 以 考察 而 改变 状态 的 原因 称 为 因素 ,如 工业 生产 中 影响 产品 质 
量 的 因素 有 原材料 、 工 艺 条 件 、 工 人 技术 水 平等 ,常用 A,B,C 等 大 写 英文 字母 表 
示 。 因 素 在 试验 中 所 取 的 各 种 不 同 状态 称 为 因素 的 水 平 , 因 素 A 的 -个 水 平常 用 
A,,4:,…,4, 表示 ,其 中 ~ 称 为 因素 A 的 水 平 数 。 若 只 考察 一 个 因素 对 指标 的 影 
响 , 这 种 试验 称 为 单 因素 试验 ,相应 的 方差 分 析 称 为 单 因素 方差 分 析 ; 若 一 个 试验 
中 同时 考察 两 个 因素 , 则 相应 的 试验 称 为 双 因素 试验 ,这 时 所 作 的 方差 分 析 称 为 双 
因素 方差 分 析 ,在 多 因素 试验 中 要 考察 的 因素 多 于 两 个 ,相应 的 方差 分 析 称 为 多 因 
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素 方差 分 析 。 

实例 1 ” 某 食品 集团 的 产品 销售 覆盖 全 国 , 主 要 分 布 于 25 个 省 份 ,是 一 个 颇 
受 消费 者 青睐 的 品牌 。 集 团 营业 部 根据 其 销售 情况 ,将 这 25 个 省 份 划分 为 东北 、 
华北 ,东南 ,西北 和 中 部 5 个 销售 区 域 ,每 个 区 域 由 一 名 销售 经 理 负责 。 年 末 将 近 ， 
各 部 门 经 理 都 在 准备 年 度 报告 。 营 业 部 总 经 理 准备 分 析 一 下 过 去 一 年 里 各 区 域 的 
销售 业绩 。 他 从 营业 部 专员 手中 得 到 了 各 省 份 销售 情况 ,发 现 东 北 地 区 今年 对 集 
团 的 收入 贡献 不 大 ,销售 量 (万 箱 ) 没 有 其 它 地 区 多 ,其 原因 可 能 在 于 该 地 区 人 口 规 
模 比 其 它 地 区 小 ,消费 习惯 存在 差异 等 。 当 然 , 这 种 差异 也 可 能 是 由 于 偶然 因素 。 
但 如 果 各 区 域 间 具 有 显著 差异 , 则 应 当 引 起 销售 部 门 的 注意 ,从 而 进一步 研究 不 同 
区 域 的 不 同 特征 ,进一步 进行 市 场 细 分 ,采取 适当 的 营销 策略 。 

在 形成 报告 之 前 ,总 经 理 决定 对 各 地 区 的 销售 量 进行 分 析 ,首先 检 验 各 区 域 间 
的 差异 是 否 由 于 偶然 原因 所 致 ,确认 各 区 域 销售 量 之 间 是 否 存在 明显 的 差异 。 

实例 2 某 公 司 为 了 研究 三 种 内 容 的 广告 宣传 对 某 种 无 季节 性 的 大 型 机 械 
销售 量 的 影响 进行 了 调查 统计 。 经 广告 广泛 宣传 后 , 按 寄 回 广告 上 的 订购 数 计算 ， 
-年 四 个 季度 的 销售 量 (单位 : 台 ) 为 

















广告 类 型 第 一 季度 第 二 季度 第 三 季度 第 四 季度 
A, 163 176 170 185 
A 184 198 179 190 
A^ 206 191 218 224 

















表 中 A, 是 强调 运输 方便 性 的 广告 ,A 是 强调 节省 燃料 经 济 性 的 广告 ,A, 是 强调 
噪音 低 的 优良 性 的 广告 。 试 判断 :新 闻 广 告 的 类 型 对 该 种 机 械 的 销售 量 是 否 有 显 
著 影 响 ? 若 影响 显著 , 哪 一 种 广告 内 容 为 好 ? 

此 例 中 ,新 闻 广 告 是 所 要 检验 的 因素 ,三 种 不 同 的 内 容 可 看 作 是 三 个 水 平 , 因 
而 这 是 一 个 单 因 素 三 水 平 的 试验 。 若 这 三 种 广告 内 容 的 宣传 对 机 械 销 售 量 的 影响 
没有 显著 差异 ,那么 从 中 采取 一 种 既 经 济 又 方便 的 广告 即 可 ; 若 有 显著 差异 , 则 和 希 
望 从 中 选取 一 种 较 优 的 方案 , 以便 对 提高 机 械 的 销售 量 更 为 有 利 。 

从 销售 量 数 据 来 看 ,好 像 不 同 广告 对 销售 量 有 一 定 影响 ;而 在 同一 种 广告 下 ， 
四 个 不 同 季节 的 销售 量 也 不 完全 一 样 ,由 于 该 机 械 无 季节 性 ,所 以 产生 这 种 差异 的 
原因 认为 是 试验 过 程 中 各 种 偶然 性 (随机 性 ) 因 素 的 干扰 所 致 ,这 一 类 误差 称 为 试 
验 误差 ,试验 误差 的 存在 使 不 同 广告 下 销售 量 的 差异 必须 进行 仔细 鉴别 。 究 竟 这 
差异 是 单纯 由 误差 引起 的 ,还 是 由 于 广告 类 型 不 同 而 引起 的 。 如 果 单 纯 是 由 误差 
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引起 的 ,那么 我 们 认为 广告 的 不 同类 型 对 销售 量 没 有 显著 影响 , 则 可 简称 因素 (新 
闻 广 告 ) 不 显著 ;如 果 不 同 广告 下 销售 量 的 不 同 ,除了 误差 影响 外 ,主要 是 由 于 广告 
类 型 (水 平 ) 不 同 所 造成 的 ,那么 我 们 就 认为 因素 的 不 同 水 平 对 销售 量 有 显著 影响 ， 
简称 因素 显著 。 方 差分 析 就 是 通过 对 试验 结果 的 分 析 去 判断 因素 本 身 及 各 因素 间 
交互 作用 对 指标 是 否 影响 显著 的 一 种 统计 方法 。 


7.2 单 因素 方差 分 析 


单 因素 方差 分 析 是 要 判断 因素 各 水 平 对 指标 是 否 有 显著 影响 ,归结 为 判断 不 
同 总 体 是 否 有 相同 分 布 的 问题 。 由 于 实际 中 常 遇 到 具有 正 态 分 布 的 总 体 ,同时 ,在 
进行 方差 分 析 时 ,除了 所 关心 的 因素 外 ,其 它 条 件 总 是 尽 可 能 使 其 保持 一 致 ,这 样 
就 可 以 认为 每 个 总 体 的 方差 相同 。 因 而 ,判断 几 个 总 体 是 否 具有 相同 分 布 的 问题 
就 简化 为 检验 几 个 具有 等 方差 的 正 态 总 体 均值 是 否 相等 的 问题 。 


1. 数学 模型 


我 们 考虑 的 因素 记 为 A ,假定 它 有 个 水 平 , 并 对 水 平 A, TET n, 次 观察 ,第 i 
水 平 的 第 7 次 观察 为 z; ,这 样 可 得 观察 资料 ( 见 表 7.2. 1) 




















表 7.2.1 观测 数据 
1 2 n, 
Ai zu Tu eee Tis 
A: zn Zn en Tus 
A Xn E Tn, 











设 z G1. 2, 3, e, n0 RE E IE NG, 0) 的 简单 随机 样本 ,i 二 1,2，3，…， 
r。 目 的 是 检验 H t p 一 p m m pes N ps 是 第 i 水平 下 试验 数据 的 理论 均 
值 ,所 以 zy =p tez, es NO, P), i=1, 2, 3, =, re p= LS nps pi 


ps — por 这 里 w 表示 第 i 水平 对 指标 的 效应 值 . 它 反映 了 因素 第 i 水 平 对 指标 的 纯 
作用 大 小 ,是 除了 因素 对 指标 的 平均 影响 后 ,因素 的 第 i 水平 对 指标 的 特殊 影响 。 





于 是 zy = pta Hey, 其 中 Dn = 0, Hot m m m m = uM 
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有 H: a 二 Qs 二 … 二 a 二 0。 从 效应 的 角度 讲 ,方差 分 析 要 解决 的 问题 是 :检验 因 
素 各 水 平 对 试验 指标 的 影响 是 否 显著 ; 若 存在 显著 的 差异 ,表明 因素 各 水 平 的 效应 
不 完全 相同 ,可 以 从 中 选 出 效应 最 大 的 水 平 即 最 优 水 平 作为 实施 方案 ; 若 无 显 著 差 
异 , 表 明 因素 各 水 平 对 试验 指标 的 影响 一 样 ,差异 是 随机 引起 的 ,这 时 可 以 从 中 选 
择 支出 最 少 或 费用 最 低 的 水 平 作为 实施 方案 。 


记 总 观察 次 数 一 27» ,组 平均 值 工 = Ls ASIE = LY) s = 


31 


LY na, MAFI AIHER 
Q= x Yos =5) 


= È S tay 一 局 时 二 EnG -I1 =Q +Q 
其 中 : Q 称 为 总 离 差 平 方 和 ,简称 总 平方 和 , 它 反映 全 部 数据 之 间 的 差异 ;Q, 称 为 
误差 平方 和 或 组 内 平方 和 ,反映 了 随机 误差 的 影响 ;Q; 称 为 组 间 平 方 和 或 因素 A 
的 平方 和 ,反映 了 各 总 体 的 样本 平均 值 之 间 的 差异 ,在 一 定 程度 上 反映 了 uus 间 的 
差异 程度 ,因而 通过 Q: 与 Q 的 相对 大 小 可 以 反映 Ho 是 否 成 立 。 

若 Q, 显著 地 大 于 Q ,说 明 工 间 的 差异 显著 地 大 于 随机 误差 ,那么 Ho 可 能 不 
成 立 。 这 种 比较 方差 大 小 以 判断 原 假设 是 否 成 立 的 方法 正 是 方差 分 析 名 称 的 由 
来 。 那么 比值 从 大 到 什么 程度 可 以 理 定 原 假设 呢 ? 从 数理 统计 理论 可 知 
一 一 
Quym 一 r| nar 
以 下 做 为 检验 统计 量 ,给 定 显著 性 水 平 w, 当 P{F(r 一 1, n— 772 F) a 时, 则 拒 
绝 Ho ,也 就 是 说 有 1 一 a 的 把 握 认 为 因素 对 指标 有 显著 影响 , 即 w 间 的 差异 是 显 
著 的 。 

通常 ,在 进行 方差 分 析 时 ,要 列 出 方差 分 析 表 7. 2. 2 。 

表 7.2.2 方差 分 析 表 


F — Fér—1.n—r) 





Jn | 平方 和 | 自由 度 "m | FK | 显著 性 


Si=Q/(r—1) 













Si=Q/(n—7) 
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从 计算 角度 讲 , 目 前 都 采用 现成 的 统计 软件 如 SPSS 等 。 对 照 第 1 节 实 例 2 
( 见 SPSS 数据 文件 ch7. 实例 2) ,我 们 采用 SPSS 软件 可 得 到 如 下 方差 分 析 表 。 


表 7.2.3 ANOVA 





Sum of Squares 





df | Mean Square 








Between Groups 2668. 167 2 1334.083 
Within Groups 1098. 500 9 122. 056 
Total 3766. 667 11 








因为 P{F(2, 9)>10. 93) —0. 0040. 05, 所 以 拒绝 H,, 即 认为 广告 内 容 不 同 
对 销售 量 的 影响 是 显著 的 。 


2. 多 重 检验 


如 果 下 检验 的 结论 是 拒绝 原 假设 , 则 表明 从 现在 掌握 的 数据 看 ,我 们 有 理由 
认为 因素 A 的 个 水 平 效 应 有 显著 差异 ,也 就 是 说 ,各 总 体 均值 不 完全 相同 。 为 了 
寻求 最 优 水 平 , 我 们 还 需 进 一 步 分 析 哪 一 些 水 平 间 差 异 是 显著 的 , 哪 一 些 是 不 显 
著 的 。 这 类 要 同时 比较 多 个 水 平 之 间 指标 差异 是 否 显 著 的 问题 就 是 多 重 比较 问 
题 。 因 为 这 些 水 平 之 间 两 两 作 了 检验 ,会 使 犯 第 一 类 错误 的 概率 增 大 , 所 以 Fish 
er 建议 , 若 原来 显著 性 水 平 为 a, 共 作 N 次 试验 , 则 把 显著 性 水 平 改 为 a/NN, 仍 用 多 
个 工 检验 。 下 面 我 们 介绍 两 种 方法 , 第 一 种 是 Tukey 提出 的 了 法 , 另 一 种 是 
Scheffe 提出 的 S 法。 

工法 的 检验 统计 量 和 显著 性 水 平 是 a 的 临界 值 分 别 为 


I _ = [ Q 
d, —|z,—z,l. dr=q.(r, n—r) GU 


HP m—nG—1, 2, 0, r), qu GG 2 一 门 可 查 表 得 到 。 当 d, 7d; 时 ,认为 第 i 水 
平 与 第 j 水 平 有 显著 差异 。 
工法 仅 适 用 于 不 同 水 平 下 重复 试验 次 数 相等 的 情况 ， 当 各 水 平 下 试验 次 数 不 


等 时 须 用 S 法 。 L= Xo. 其 中 ci = 1.2, n 不 全 为 0， [535 一 0。 


L= Y, 则 当 
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77 
IPEA Dr DÄ 


-pg Ny 
时 ,认为 假设 Ho: L=0 不 成 立 。 此 检验 也 可 用 在 两 两 比较 上 ,只 要 取 |L|=d; 
即 可 。 
我 们 还 可 以 对 每 一 对 us 和 jj 之 间 的 差异 程度 作出 估计 ,这 就 要 对 效应 之 差 
p. — us, 作 区 间 估 计 。 由 数理 统计 理论 知识 ,对 固定 的 i, jo jy; 一 的 置信 系数 1 一 “ 
的 置信 区 间 由 最 小 显著 差异 法 (LSD) 可 得 


ptem 
G,—x, —,[ C- 33st qn», x, t Go bs t; (—70) 
n n, : n n d 


由 修正 最 小 显著 差异 法 (Bonferroni) 可 得 


HET 
(s, col ce |a ist tg(n— n. z,—z, eG dst tg (n — 7) 
其 中 m 为 区 间 的 个 数 。 如 果 这 个 区 间 包 含 零 , 则 表明 我 们 可 以 以 概率 1 一 a 断言 
pi 和 jp, 没有 显著 差异 ;如 果 整 个 区 间 落 在 零 的 左边 , 则 我 们 以 概率 1 一 a 断言 p 

小 于 pj ;相反 ,如 果 整 个 区 间 落 在 零 的 右边 , 则 我 们 以 概率 1 一 a 断言 y, KF use 
对 于 第 1 节 实 例 2( 见 SPSS 数据 文件 ch7。 实 例 20 ,我 们 采用 SPSS 软件 可 
得 如 下 结果 。 
表 7.2.4  Descriptives 


95% Confidence Interval for Mean 





N | Mean |Std. Deviation Std. Error 
Lower Bound | Upper Bound 














1 4 173.50 9.33 4.66 158. 66 188. 34 
2 4 187.75 8.18 4.09 174. 73 200. 77 
3 4 209.75 14.57 7.28 186.57 232.93 
Total 12 190. 33 18.50 5.34 178.58 202. 09 








37.2.5 Test of Homogeneity of Variances 





Levene Statistic df, df; Sig. 














1.091 2 9 .377 
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37.2.6 Multiple Comparisons 


Dependent Variable. 销售 量 
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Mean Differ- 95% Confidence Interval 
(D [CD Std. Error Sig. 
ence (1—J) | Lower Bound | Upper Bound 
T 
LSD i 2 一 14. 25 7.812 | .101 91.92 3. 42 
3 —36. 25 7.812 | .001 一 53. 92 一 18. 58 
2 1 14. 25 7.812 .101 | —3.42 31. 92 
3 —22. 00 7.812 |.020| —39.67 4.33 
3|1 36. 25 7.812 | .001 18. 58 53. 92 
2 22. 00 7.812 .020 4.33 39. 67 
Bonferroni | 1 2 —M.25 7.812 . 304 —37.17 8.67 
3 —36.25 7.812 . 004 —59.17 713. 33 
2/1 14.25 7.812. | .304 —8. 67 37.17 
3 — 22.00 7.812 .061 —44.92 92 
3 1 36. 25 7. 812 .004 13. 33 39. 17 
2 22.00 7.812 .061 -.92 44.92 























由 以 上 结果 可 见 , 三 个 水 平 对 应 的 三 个 总 体 的 方差 具有 齐 性 (第 二 个 表 )。 第 


三 种 广告 引起 的 销售 量 最 多 (第 一 个 表 、 第 





= 个 表 ) ,第 三 水 平 为 最 优 水 平 。 在 今后 


的 广告 宣传 中 ,应 多 宣传 噪音 低 的 优良 性 ,这 对 增加 销量 有 好 处 。 同 时 ,应 进一步 


进行 工艺 改革 以 降低 噪音 。 


例 7.2.1 某 种 型 号 化 油 器 的 原 中 小 喉 管 的 结构 油耗 较 大 。 为 节约 能 源 , 设 
想 了 两 种 改进 方案 以 降低 油耗 指标 一 一 比 油耗 , 现 对 用 各 种 结构 的 中 小 喉 管 制造 
的 化 油 器 分 别 测 得 一 批 数据 ,试问 中 小 喉 管 的 结构 对 比 油耗 的 影响 是 否 显著 ? 并 


提出 改进 方案 。 
原始 数据 表 


原 结构 比 油耗 231.0 232.8 227.6 228.3 224.7 


改进 方案 1 比 油耗 — 222.8 
改进 方案 2 比 油 耗 224.3 
解 ”应 用 SPSS 软件 ( 见 SPSS 数据 文件 例 7. 2. 1) 可 得 如 下 结果 。 


224.5 
226. 1 


218.5 
221.4 


225.5 
220.2 


223.6 


229.3 230.3 
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表 7.2.7 Descriptives 





95% Confidence Interval for Mean 
N Mean |Std. Deviation| Std. Error 





Lower Bound | Upper Bound 











1 8 228. 6875 2.7420 .9694 226. 3952 230. 9798 
2 4 221. 5000 2.6696 1. 3348 217. 2521 225. 7479 
3 4 223.8500 | 1. 9434 .9717 220. 7577 226.9423 


5. 6813 4.0082 1.0020 223. 5454 227.8171 

















表 7.2.8 Multiple Comparisons 


Dependent Variable: 比 油耗 
















































Mean 95% Confidence Interval 
(D| (QD | Difference |Std. Error Sig. 
z Lower Bound | Upper Bound 
nN 
LSD 1|2 7. 1875 3. 7979 10.5771 
3 4.8375 1.569 | .009 | 1.4479 8. 2271 
2 | 1 | -7.1875 1.569 | .001 | 一 10.5771 一 3.7979 
3 | 一 2.3500 1.812 | .217 | 一 6.2639 1. 5639 
3 | 1 | 一 48375 1.569 | .009 | —8.2271 —1.4479 
2 2. 3500 1.812 | .217 | —1.5639 6. 2639 
表 7.2.9. Test of Homogeneity of Variances 
Levene Statistic | df, dí, | Sig. 
13 576 
表 7.2.10 ANOVA 
一 
Sum of Squares | df Mean Square F Sig. 
Between Groups 155. 646 2 77.823 11.855 | .001 
Within Groups 85. 339 13 6.565 
Total 240. 984 15 
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由 此 可 知 不 同 的 中 小 喉 管 结构 的 比 油耗 有 显著 差异 ,从 上 图 可 以 看 出 改进 方 
案 1 的 比 油耗 最 小 ,采用 这 种 结构 有 可 能 节省 油耗 。 





例 7.2.2 


有 以 下 四 种 产品 : 


Ais 国外 同类 产品 ; A,， 本 厂 产品 ; Ass 








国 





内 


甲 厂 同类 产品 ; A,, 国内 乙 厂 同类 产品 。 现 从 各 厂 产 品 中 分 别 取 2,10,6,6 个 产 
品 做 300 小 时 连续 磨损 老化 试验 ,得 变化 率 数据 为 


@ 外 国 


A 变化 率 12 14 
A: 变化 率 20 18 19 17 15 16 13 18 22 17 
As 变 化 率 26 19 26 28 23 25 
A ÆR 24 25 18 22 27 24 


假定 各 厂 变 化 率 服从 等 方差 的 正 态 分 布 。 

CD 试问 四 个 三 的 产品 的 变化 率 有 否 显著 差异 ? 

(2) 车 有 差异 的 话 ,请 进一步 检验 :@ 外 国产 品 与 本 厂 产品 有 无 显著 差异 ; 
品 与 国内 产品 有 无 显著 差异 ;@ 本 厂 产 品 与 国内 产品 有 无 显著 差异 。 
利用 SPSS 软件 ( 见 SPSS 数据 文件 例 7. 2. 2) 可 得 如 下 结果 。 ' 


7.2.11 


解 


Descriptives 变化 率 








































95% Confidence Interval for Mean 
N Mean |Std. Deviation| Std. Error 
Lower Bound Upper Bound 
1 2 13.00 1.41 1.00 .29 25.71 
2 10 | 17.50 2.55 .81 15.68 19. 32 
3 6 24.50 3.15 1.28 21.20 27.80 
4 6 23.33 3.08 1.26 20.10 26.56 
Total| 24 | 20.33 4.68 .95 18. 36 22.31 
3 7.2.12. Test of Homogeneity of Variances 变化 率 
Levene Statistic | df, | dí; | Sig. 
.358 3 20 .784 
37.2.13. ANOVA 变化 率 
Sum of Squares df Mean Square Hk Sig. 
Between Groups 346. 000 3 115. 333 14. 661| . 000 
Within Groups 157. 333 20 7.867 
Total 503. 333 23 
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表 7.2.14 Contrast Coefficients 

















Contrast 1 2 3 4 
1 1 -1 0 0 
2 =$ 1 1 1 
3 0 2 -— -— 
表 7.2.15 Contrast Tests 
Contrást Value of Std. z at Sig. 
Contrast Error K2 - tailed) 
Assume equal 1 —4.50 2.17 —2.071 20 .051 
variances 2 26.33 6.23 4.227 20 . 000 
3 —12.83 2.40 —5. 343 20 .000 
Does not assume 1 —4.50 1.28 — 3.503 2.600 .049 
equal variances 2 26.33 3.59 7.338 2.020 .018 
3 —12.83 2.41 —5.316 | 18.937 .000 

















Æ 7.2.16 Multiple Comparisons 
Dependent Variable; 2: 4f 3 











per Bound 


19E— 02 
-—6.72 
—5.56 
9.03 
—3.98 
—2.81 
16.28 
10.02 
4.54 


Mean 95% Confidence Interval 
(D| QD) | Difference — |Std. Error| Sig. 
a-p Lower Bound | Up 
LSD 1 2 —4.50 2.173 .051 —9.03 3. 
3 —11.50 2.290 .000 — 16.28 
4 — 10. 33 2. 290 .000 —15. 11 
2 1 4.50 2.173 .051 | 一 3. 19E— 02 
8 一 7.00 1.448 .000 —10.02 
4 —5. 83 1.448 .001 —8.85 
3 1 11.50 2.290 .000 6.72 
2 7.00 1.448 .000 3.98 
4 1.17 1.619 .480 —2.21 
4 1 10.33 2. 290 .000 5.56 


























15.11 
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续 表 7.2. 16 
Mean 95% Confidence Interval 
|cD| J) | Difference — |Std. Error| Sig. 
a-n Lower Bound | Upper Bound 
2 5.83 1. 448 .001 2.81 8.85 
3 | -1.17 1.619 | .480 | —4.54 2.21 
由 以 上 结果 可 以 看 出 ,四 个 厂 产品 的 变化 率 有 显著 差异 。 又 进行 对 比 检验 得 


出 ,外 国产 品 与 本 厂 产品 无 显著 差异 ,而 外 国产 品 与 国内 产品 、 本 厂 产 品 与 国内 产 
品 均 有 显著 差异 。 


7.3 应 用 SPSS 进行 单 因 素 方 差分 析 


1. 建立 数据 文件 

启动 Windows 后 ,双击 SPSS 图 标 或 单 击 “ 开 始 一 程序 一 SPSS ”, SPSS 软件 
开始 运行 。 启 动 SPSS 后 ,出 现 的 界面 是 数据 编辑 窗口 , 它 的 底部 有 两 个 标签 : 
Data View( 数 据 视窗 ) 和 Variable View( 变 量 视窗 )。 在 Variable View 中 定义 变 
量 , 输 入 变量 名 ,定义 变量 类 型 :Numeric( 数 值 型 ) 或 String( 字 串 型 ); 定 义 列 宽 : 
Width; 定 义 小 数位 :Decimal; 输 入 变量 标签 ,变量 值 标签 等 。 将 每 个 变量 定义 之 
后 ,在 Data View 进行 数据 的 输入 与 编辑 。 逐 列 输入 数据 或 字 串 ,从 而 在 数据 编辑 
窗 建立 了 数据 文件 。 

比如 , 为 某 职业 病 防治 院 对 31 名 石棉 矿工 中 的 石棉 肺 患者 、 可 疑 患 者 和 非 患 
者 进行 了 用 力 肺 活 量 测定 ,数据 如 下 表 所 示 , 问 三 组 石棉 矿工 的 用 力 肺 活 量 有 无 差 
别 ? 
表 7.3.1 三 组 石棉 矿工 的 用 力 肺活量 


























石棉 肺 
ka ix 1.5 | 2.1 | 1.9 | 1.7 | 1.8 | 1.9 | 1.8 | 1.8 | 2.0 
矿工 | | 
up BE E 25 | 2a 2.1 2i |26 | 2s 2.3 | 2.4 | 2.4 
| 

















2.8 | 2.7 | 3.0 | 3.4 | 3.0 | 34 | 3.3 | 3.5 


非 患者 | 2.9 3.2 | 2.7 


在 变量 视窗 中 定义 两 个 变量 :(1) 组 别 g, 数 值 型 , 取 值 1,2,3, 分 别 代表 三 组 石 
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棉 矿 工 的 石棉 肺 矿工 、 可 疑 患 者 和 非 患者 ;(2) 肺 活 量 x, 数值 型 。 在 数据 视窗 中 输 
入 数据 。 数 据 输入 的 文件 结构 为 表 7. 3. 2。 





2. 进行 方差 分 析 


Jti" Analyze Compare Mean—>One—> Way ANOVA ", f£ One Way ANOVA 
对 话 框 中 ,分 别 指定 方差 分 析 的 指标 (Dependent List) 和 因素 (Factor) , 单 击 OK 即 
输出 单 因素 方差 分 析 结果 如 表 7. 3. 3。 
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7.3.3 ANOVA 肺活量 





— 
Sum of Squares df Mean Square F | Sig. 





Between Groups 





Within Groups 




















Total 


车 Sig. 值 很 小 , 则 表明 :三 组 石棉 矿工 的 用 力 肺活量 有 差异 ,但 并 不 表明 任何 
两 两 组 间 矿 工 的 用 力 肺活量 均 有 差异 。 如 要 知道 具体 哪 两 组 均 数 间 有 差异 ,还 需 
要 使 用 One->Way ANOVA 的 选择 项 进行 多 重 比较 。 


3. 多 重 比较 


在 One Way ANOVA 对 话 框 中 , 单 击 Contrasts( 指 定 一 种 要 用 1 检验 来 检 
验 的 Priori 对 比 ) 或 单 击 Post Hoc( 指 定 一 种 多 重 比较 检验 , 当 方 差 齐 性 时 有 14 
种 , 当 方 差 非 齐 性 时 有 4 种 )。 选 择 好 后 , 单 击 Continue( 继 续 ) ,返回 One 一 Way 
ANOVA 对 话 框 。 再 单 击 Option, 打开 选择 输出 统计 量 的 对 话 框 , 单 击 Descrip- 
tive, 计 算 并 输出 : 例 数 ,均值 标准 差 、 标 准 误 、 均 数 的 95% 置 信 区 间 、 最 小 值 和 最 
大 值 。 单 击 Homogeneity-of-Variance, 方 差 齐 性 检验 ,然后 单 击 Continue, 返 回 
One-- Way ANOVA 后 ,再 单 击 OK 即 出 现 需 要 的 一 系列 表格 。 

停 下 来 想 一 想 , 在 现实 生活 中 是 不 是 有 许多 可 以 用 方差 分 析 方法 解决 的 问题 。 
如 根据 美国 1986 年 有 关 48 个 大 陆 州 的 综合 犯罪 报告 ,将 48 个 州 分 成 7 个 地 区 
CR 7. 3.4) ,研究 这 7 个 地 区 的 犯罪 率 是 否 不 同 。 

又 如 失业 率 是 否 因为 地 区 的 不 同 而 不 同 ; 有 一 群 老 人 分 别 住 在 5 个 疗养 院 ,每 
个 疗养 院 中 有 20 人 ,给 他 们 服用 抗 抑郁 剂 , 试 判断 老人 服药 的 剂量 与 所 住 的 疗养 
院 是 否 有 关 ; 按 照 一 定 标准 ,给 各 个 专业 打分 ,然后 对 各 个 二 级 学 院 进行 比较 ;由 受 
过 训练 的 品尝 家 对 几 种 同类 食品 进行 品尝 打分 ,然后 进行 比较 ;等 等 。 希 望 读者 能 
动脑 筋 用 学 习 的 知识 解决 一 些 实际 问题 。 
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表 7.3.4 
犯罪 率 m 犯罪 率 
州 序号 (每 十 万 人 ) 地 区 州 序号 (每 十 万 人 ) 地 区 

1 147 25 164 

2 | mw 26 .— 476 

3 149 Ax. 27 675 

4 557 we 28 588 

5 226 29 1036 

6 426 30 334 南方 
7 989 31 540 

8 572 中 大 西洋 32 558 

9 359 33 274 

10 423 34 395 

11 308 35 758 

12 800 36 436 

13 804 37 659 

14 258 38 658 ENT 
15 285 39 726 

16 235 RAW 40 293 

17 263 4l 524 

18 578 42 157 

19 51 43 222 MENR 
20 125 m 267 

21 369 45 719 

22 427 46 437 

23 833 南方 47 550 太平 洋 岸 
24 306 48 920 




















7.4 双 因 素 方差 分 析 


在 许多 实际 问题 中 ,往往 需要 同时 考察 几 个 因素 对 指标 的 影响 。 比 如 在 第 1 
节 实 例 2 中 ,对 机 械 销 售 量 的 影响 除了 考察 新 闻 广 告 形式 外 ,常常 还 考察 机 械 的 销 
售 价 格 。 同 时 研究 两 个 因素 对 试验 指标 的 影响 ,就 是 双 因 素 方差 分 析 问 题 。 

由 于 存在 两 个 因素 的 影响 ,就 产生 一 个 新 问题 ,两 因素 对 指标 的 影响 是 否 正好 
是 它们 每 个 因素 对 指标 影响 的 迁 加 ? 比如 第 1 节 中 实例 2, 是 否 会 产生 这 样 的 情 


第 7 章 方差 与 协 方差 分 析 BU 


况 ,分别 使 销售 量 达 到 最 高 的 广告 和 价格 (在 不 低 于 成 本 的 情况 下 ?结合 起 来 ,会 使 
销售 量 增加 的 幅度 超过 (或 低 于 ) 二 者 分 别 增加 的 幅度 之 和 。 这 种 各 个 因素 的 不 同 
水 平 的 搭配 所 产生 的 新 的 影响 在 统计 上 称 为 交互 作用 。 各 因素 间 是 否 存在 交互 作 
用 是 多 因素 方差 分 析 新 产生 的 问题 。 下 面 先 介绍 无 交互 作用 的 双 因 素 方差 分 析 技 























术 。 
双 因素 方差 分 析 的 数据 结构 为 ( 表 7. 4. 1) 。 
表 7.4.1 
Bi B. B, m" B, 
A Tu Tu ERST se T. 
A: zn In zn - E 
A Zn fa E 和 
1. 数学 模型 


若 因素 A 的 第 i 种 效应 和 因素 B 的 第 j 种 效应 分 别 记 作 a,, B 试验 误差 记 作 
e, ,那么 





z; =p+a: +B te =l, 2, ,rj=1,2,.%,s), 
Kp 
; a, 一 0， Simei 
" E 1,2, e, r), Å =T; —I (j=l, 2, =, s) 
JFBABGE e, — NO, ò). 
2. 方差 分 析 


判断 因素 A 是 否 显著 ,等 价 于 检验 假设 Ho : ai 二 a 二 … 二 a, 二 0, 而 判断 因素 
B 是 否 显著 等 价 于 检验 假设 有 Hs。: Bi 一 B 二 … 二 B, 二 0。 为 了 检验 这 些 假设 , 同 单 
因素 方差 分 析 类 似 ,将 总 离 差 平方 和 Q 进行 分 解 


Q—-YXG,-:-2Q-Q-Q 
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其 中 Q =s) G LI, Q —75]G,—0,Q — 3] D(z aT, 


gii. _ Q/(r—1) ed Q./G—0D T 
取 检验 统计 量 Fa 一 可 一 tr 一 D0 一 gor DG 2 28 
个 假设 进行 检验 。 


为 方便 起 见 , 通 常 也 列 出 如 下 方差 分 析 表 7. 4. 2。 
表 7.4.2 双 因 素 方差 分 析 表 




















方差 来 源 | 平方 和 | nag | 均 方 下 值 | 显著 性 
A Q mı | 3 Si /号 
B Q. 1 | s [ss 
误差 Q (r—-DG-D Si 
总 和 Q rs—1 














关于 计算 问题 ,我 们 同样 利用 SPSS 软件 来 实现 。 

例 7.4.1 为 提高 某 种 产品 的 合格 率 ,考察 原料 用 量 和 来 源 地 对 其 是 否 有 影 
响 。 原 料 来 源 地 有 三 个 :甲乙 , 丙 。 原 料 用 量 有 三 种 : 现 用 量 、 增 加 5%、 增 加 8%。 
每 个 水 平 组 合 各 做 一 次 试验 ,得 到 的 数据 如 表 7. 4. 3 所 示 。 














表 7.4.3 
现 用 量 (1) 增加 5%(2) 增加 8%(3) 
甲 地 (1) 59 70 66 
乙 地 (2) 63 | 74 70 
两 地 (3) 61 | 66 n 











试 分 析 原 料 用 量 及 来 源 地 对 产品 合格 率 的 影响 是 否 显著 。 

解 ” 设 原料 来 源 地 为 因素 A, 三 个 地 区 为 因素 A 的 三 个 水 平 ,第 i 个 水 平 对 
合格 率 的 特殊 效应 为 a:(i 二 1, 2, 30 ;原料 用 量 为 因素 B, 三 种 用 料 量 为 因素 B 的 
三 个 水 平 ,第 j 个 水 平 对 合格 率 的 特殊 效应 为 B,(j 二 1, 2, 3), 则 原 假 设 为 

Hoa :a=a=a=0 Ho :有 一 及 一 及 一 0 
由 SPSS 软件 ( 见 SPSS 数据 文件 例 7. 4. 1) 可 得 如 下 结果 见 表 7.4.4。 
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表 7.4.4 Tests of Between-Subjects Effects 
Dependent Variable: 合 格 率 








Source Type III Sum of Squares| df | Mean Square F Sig. 
Corrected Model 172. 000 4 43. 000 6.143 .053 
Intercept 40000. 000 1 40000.000 | 5714.286 .000 
A 26. 000 2 13. 000 1.857 . 269 
B 146. 000 2 73. 000 10. 429 .026 
Error 28. 000 4 7.000 
Total 40200. 000 9 
Corrected Total 200, 000 8 























这 里 显著 性 水 平 a 二 0.05， 从 上 表 可 见 ,不 能 拒绝 Ho ,但 能 拒绝 Ho,。 即 根 
据 现 有 数据 资料 ,有 95% 的 把 握 推 断 原料 来 源 地 对 产品 合格 率 影响 不 大 ,而 原料 
用 量 对 合格 率 有 显著 影响 , 见 表 7. 4. 5 一 表 7. 4. 6。 


37.4.5 Estimates 


Dependent Variable: £y fft 3& 










95% Confidence Interval for Mean 




















原料 用 量 Mean Std. Error 
Lower Bound Upper Bound 
1 61. 000 56.759 65. 241 
2 70. 000 65.759 74. 241 








69. 000 64. 759 73. 241 








37.4.6 Multiple Comparisons 
Dependent Variable; 产品 合格 率 





95% Confidence Interval 
《DD 原料 | (J) 原料 | Mean Differ- 














Sig. 
用 量 | 用 量 | ence (IT 一 六 | Sid. Error| ^ 
Lower Bound | Upper Bound 
LSD 1 2 —9.00 2.160 .014 — 15. 00 一 3.00 
3 —8. 00 2.160 .021 —14. 00 — 2.00 
2 1 9.00 2.160 .014 3.00 15. 00 
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续 表 7.4.6 
95% Confidence Interval 
DE | J) 原料 | Mean Differ- "" 
用 量 用 量 | ence (I—J) | Std. Error 
Lower Bound | Upper Bound 
3 1.00 2.160 .667 —5.00 7.00 
3 1 8.00 2.160 | .021 2.00 14. 00 
2 —1.00 2.160 |.667| —7.00 5.00 
Bonferroni| 1 2 | -90 2.160 |.042| 一 17.56 —.44 
3 | —8.00 2.160 |.062| —16.56 .56 
2 1 9.00 2.160 | .042 "m 17.56 
3 1.00 2.160 |1.000| 一 7.56 9.56 
3 1 8.00 2.160 | .062 —.56 16. 56 
2 —1.00 2.160 .|1.000|  —9.56 7.56 


























由 此 可 见 , 原 料 用 量 对 产品 合格 率 影响 显著 ，B， 水 平 为 最 优 水 平 。 原 料 来 源 地 对 
产品 合格 率 影响 不 显著 ,因而 可 考虑 以 方便 且 运费 低 为 准则 选择 水 平 。 比 如 乙 地 
最 方便 且 运 输 距离 短 , 那 么 最 优 条 件 为 A;B,， 即 采用 乙 地 原料 并 在 原 有 用 料 量 上 
增加 5%, 这 一 方案 为 最 佳 。 

例 7.4.2 根据 下 面 资料 ( 见 表 7.4.7) 分 析 不 同 地 区 和 不 同时 间 对 农民 家 庭 
人 均 纯 收入 (单位 :元 ) 的 影响 。 


表 7.4.7 农民 家 庭 人 均 纯 收 入 



































时 间 m 北京 (1) | 天 津 (2) | 河北 (3) | 山西 (4) | 内 蒙古 (5) 
1980 年 (1) 290. 46 277.92 175.78 155. 78 181.32 
1981 年 (2) 350. 67 297.77 204.41 179.53 225.14 
1982 年 (3) 432.63 326.12 235.73 227.18 273.03 
1983 年 (4) 519. 48 411. 69 298. 07 275.78 294. 20 
1984 年 (5) 664. 16 504. 64 345. 00 355. 50 336. 12 
1985 年 (6) 775. 08 564. 55 385. 23 358. 32 360.41 


请 根据 由 SPSS 软件 得 到 的 结果 ,做 出 统计 分 析 。 
解 ”利用 SPSS 可 得 以 下 结果 ( 见 表 7. 4. 8 一 7. 4. 10)。 
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表 7.4.8 Tests of Between 一 Subjects Effects 
Dependent Variable: 人 均 纯 收 入 








Type II Sum 








Source 这 df Mean Square F Sig. 
Corrected Model 559996. 822(a) 9 62221. 869 25. 831 .000 
Intercept 3526657. 960 1 3526657. 960 1464. 080| . 000 
A 286626. 752 5 57325. 350 23. 798 . 000 
B 273370. 070 4 68342. 517 28.372 .000 
Error 48175. 739 20 2408. 787 
Total 4134830. 521 30 

















Corrected Total 608172. 560 29 


a R Squared = .921 C Adjusted R Squared = . 885) 


由 此 可 见 , 时 间 和 地 区 两 个 因素 对 人 均 纯 收入 都 有 显著 差异 。 下 面 仅 对 时 间 因 
素 进行 分 析 。 


表 7.4.9 Estimates 


Dependent Variable; 人 均 纯 收入 







95% Confidence Interval 





































时 间 Mean Std. Error 
Lower Bound Upper Bound 
1980 年 217.052 21.949 171. 267 262. 837 
1981 年 251.504 21.949 205. 719 297. 289 
1982 年 298. 938 21.949 253. 153 344. 723 
1983 年 359. 844 21.949 314. 059 405. 629 
1984 年 441. 084 21.949 395. 299 486. 869 
1985 年 488. 758 21.949 442. 973 534. 543 





3k 7.4.10 Multiple Comparisons 
Dependent Variable; 人 均 纯 收入 
LSD 










Mean Difference 95% Confidence Interval 
Std, Error | Sig. 
a-n) Lower Bound | Upper Bound 








(D 时 间 





一 34. 4520 31. 04053 | . 280 一 99. 2014 30. 2974 














一 81.8860'… 31.04053 | .016 | 一 146. 6354 —17.1366 
robs uini ha ee 





(DD 时 间 


1981 年 


1982 年 


1983 年 


1984 年 


1985 年 
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CD 时 间 


1983 年 
1984 年 
1985 年 
1980 年 
1982 年 
1983 年 
1984 年 
1985 年 
1980 年 
1981 年 
1983 年 
1984 年 
1985 年 
1980 年 
1981 年 
1982 年 
1984 年 
1985 年 
1980 年 
1981 年 
1982 年 
1983 年 
1985 年 
1980 年 
1981 年 
1982 年 
1983 年 
1984 年 





Mean Difference 
qa-op 
—142. 7920'*" 
— 224. 0320'*? 
— 271. 7060'*? 
34. 4520 
— 47. 4340 
—108. 3400'*? 
— 189. 5800'*? 
— 237. 2540'*" 
81. 8860'** 
47. 4340 

— 60. 9060 

一 142. 1460'*? 

一 189. 8200' *? 
142. 7920." 
108. 3400**" 
60. 9060 

— 81. 2400'*? 

—128. 9140*** 
224. 0320'** 
189. 5800'*? 
142. 1460«*? 
81. 2400'*? 

—47.6740 
271. 7060'*? 
237. 2540! ^ 
189. 8200**^ 
128. 9140'*? 
47. 6740 








Based on observed means 


Std. Error 


31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 
31. 04053 


* The mean difference is significant at the . 05 level 


Sig. 


.000 
.000 
.000 
.280 
.142 
.002 
.000 
. 000 
.016 
.142 
. 064 
.000 
. 000 
. 000 
.002 
.064 
.017 
. 000 
. 000 
.000 
. 000 
.017 
.140 
.000 
. 000 
. 000 
.000 








.140 


Lower Bound 


— 207. 5414 
— 288. 7814 
— 336. 4554 
— 30. 2974 
—112. 1834 
—173.0894 
— 254. 3294 
— 302. 0034 
17.1366 

一 17. 3154 
一 125. 6554 
一 206. 8954 
一 254. 5694 
78. 0426 
43. 5906 

— 3. 8434 
— 145. 9894 
— 193. 6634 
159. 2826 
124. 8306 
77. 3966 
16. 4906 

— 112. 4234 
206. 9566 
172. 5046 
125.0706 
64. 1646 
—17.0754 





续 表 7.4.10 


95% Confidence Interval 
Upper Bound 


— 78.0426 
— 159.2826 
— 206. 9566 

99. 2014 
17. 3154 

—43.5906 
—124. 8306 
—172.5046 

146. 6354 
112. 1834 
3. 8434 

— 11.3966 
—125.0706 

207.5414 

173. 0894 
125. 6554 

— 16. 4906 

— 64.1646 

288. 7814 

254. 3294 

206.8954 
145. 9894 

17.0754 
336. 4554 
302. 0034 
254. 5694 
193. 6634 
112. 4234 
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例 7.4.3 某 酿造 厂 有 三 个 化 验 员 担任 发 酵 粉 的 颗粒 检验 , 今 由 三 名 化 验 员 
每 天 从 该 厂 所 生产 的 发 酵 粉 中 抽样 一 次 , 共 抽 10 天 ,分 别 化 验 其 中 所 含 颗粒 的 百 
分 率 ,化 验 结果 如 表 7.4. 11 所 示 , 问 三 名 化 验 员 的 技术 有 无 显著 差异 ? 这 10 天 生 
产 的 发 酵 粉 的 颗粒 百分率 有 无 显著 差异 ? 


表 7.4.11 














解 ”应 用 SPSS 软件 可 得 如 下 结果 。 


表 7.4. 12 Tests of Between - Subjects Effects 
Dependent Variable: 百分率 























Source VORAUS df |MeanSqure| F Sig. 
of Squares 
Corrected Model 164. 396 11 j 14.945 1978. 027 .000 
Intercept 1058. 508 1 1058. 508 140096. 647 .000 
A 2. 400E— 02 2 1.200E—02 1.588 .232 
B 164.372 9 18.264 2417. 235 .000 
Error .136 18 7.556E— 03 
Total 1223. 040 30 
Corrected Total 164. 532 29 


由 此 可 知 , 三 个 化 验 员 的 化 验 技术 没有 显著 差异 ,这 10 天 生产 的 发 酵 粉 的 颗 
粒 百分率 有 显著 差异 。 

下 面 简单 介绍 有 交互 作用 的 双 因素 方差 分 析 技 术 。 

在 前 面 的 内 容 中 已 经 知道 ,如 果 因 素 A 和 因素 B 没有 交互 作用 , 则 只 需要 在 
各 个 组 合 水 平 下 各 做 一 次 试验 就 可 以 进行 方差 分 析 。 但 是 如 果 因 素 A 和 因素 B 
有 交互 作用 ,这 是 必须 在 各 个 组 合 水 平 下 做 重复 试验 方 可 进行 方差 分 析 。 下 面 通 
过 一 个 例子 来 具体 说 明 。 

907.4.4 抗 牵 拉 强 度 是 硬 橡 胶 的 一 项 重要 的 性 能 指标 , 现 试 验 考察 下 列 两 


182 概率 统计 与 SPSS 应 用 





个 因素 对 该 指标 的 影响 。 

A( 硫 化 时 间 ): A, (40 秒 ) ,A:(60 ED 。 

B( 催 化 剂 种 类 ) :B, ( 甲 种 ),B:( 乙 种 ),B:( 丙 种 ) 。 

六 种 组 合 水 平 下 ,各 重复 做 了 两 次 试验 , 测 得 数据 (单位 :kg/cm?) 如 下 表 , 试 
问 因素 A .因素 B 对 该 指标 的 影响 是 否 显著 ? 








表 7.4.13 
| B, | B, B, 
A 390 380 440 420 370 350 
A: 390 410 450 430 370 380 


解 MIHI SPSS 软件 ( 见 SPSS 数据 文件 例 7.4.4) 可 得 如 下 结果 。 


37.4.14. Tests of Between-Subjects Effects 
Dependent Variable; 强度 
























: Type III Sum 
Source | df Mean Square F Sig. 
| | of Squares 
Corrected Model | 9866. 667 5 1973. 333 13. 156 .003 
Intercept 190403. 33 1 1904033. 333 12693. 556 .000 
A 533. 333 l 533. 333 3.556 .108 
B 9316. 667 2 4658, 333 31. 056 .001 
A.* B 16.667 2 | 8. 333 . 056 .946 
Error 900. 000 6 | 150. 000 
Total 1914800. 000 12 
Corrected Total 10766. 667 11 | 








由 此 可 见 , 因 素 B 显著 ,而 因素 A 和 A 与 B 交互 作用 都 不 显著 。 下 面 着 重 考 
察 因素 B。 
表 7.4.15 Estimates 
Dependent Variable: 强度 





95% Confidence Interval 





B Mean Std. Error 














Lower Bound Upper Bound 
1 392. 500 6.124 377.516 407, 484 
2 435. 000 6.124 420. 016 449. 984 
3 367. 500 6.124 352. 516 382. 484 








第 7 章 方差 与 协 方差 分 析 


183 





38 7.4.16 — Pairwise Comparisons 
Dependent Variable. 强度 





Mean Difference 95% Confidence Interval for Difference 
CDB | JB Std. Error| Sig. | 
a-p | Lower Bound Upper Bound 













1 —42. 500 008 | —70. 970 
25. 000 .083 —3.470 
2 42. 500 008 14. 030 
67. 500 .001 39.030 
3 — 25. 000 —53.470 


一 67. 500 





一 14.030 
53. 470 
70.970 

.970 

3.470 

—39. 030 





Based on estimated marginal means, Adjustment for multiple comparisons; Bonferroni 


表 7.4.17 4 * B 
Dependent Variable; 强度 





95% Confidence Interval 





A Std. Error 
Lower Bound 

1 385. 000 363. 809 
430. 000 108. 809 
360. 000 338. 809 

2 400. 000 378. 809 
440. 418. 809 
375. 353. 809 





Upper Bound 
406. 
451. 
381. 
421. 
461. 
396. 


191 
191 
191 
191 
191 
191 


根据 指标 的 实际 意义 ,从 以 上 结果 可 见 , 乙 种 催化 剂 . 硫 化 时 间 60 s 可 使 硬 橡胶 
的 抗 牵 拉 强度 达到 最 大 。 如 果 仅 考虑 显著 性 因素 而 不 考虑 非 显著 性 因素 ,可 以 认为 





选 乙 种 催化 剂 可 使 硬 橡胶 的 抗 牵 拉 强度 达到 最 大 ,考虑 成 本 问题 , 


选 硫化 时 间 40 s. 


7.5 应 用 SPSS 进行 双 因 素 方 差分 析 


1. 无 交互 作用 情形 


建立 数据 文件 ,包含 三 个 变量 :因素 1、 因 素 2、 指 标 。 
单 击 Analyze— General Linear Model-~ Univariatel. . . 


,将 指标 变量 移入 
Dependent 栏 ,两 个 因素 都 移 人 Fixed Factor(s) 栏 ; 单 击 Model. 


.. ,选择 Custom, 
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将 Factors 栏 中 项 全 部 移入 Model 栏 中 , 选 Main effect, 3€ Include intercept in 
model, 单 击 “Continue”; 车 对 Fixed Factor 进行 多 重 比较 ,可 单 击 Post Hoc...， 
进行 选项 ; 单 击 "Plots” ,确定 Horizontal Axis 和 Separate Lines, Jf f; Add, A id 
Contrasts, 指定 每 个 Factors, 在 Contrast 下 拉 式 菜单 中 选 Simple, 击 “Change”， 
并 选 Reference 中 的 Last 或 First, 还 可 在 Options 的 下 拉 式 菜 中 进行 选项 ,最 后 
单 击 *OK”。 

表 7.5.1 Tests of Between-Subjects Effects( 各 目标 效应 之 间 的 检验 ) 


Dependent Variable: 





Source Sum of Squares | dí. | Mean Square 





F | Sig. 





Varl 
Var2 


Error 








Corrected Total 





2. 有 交互 作用 情形 
建立 数据 文件 。 


单 击 Analyze->General Linear Model-Univariatel ... ,在 Univariatel ... 对 
话 框 中 ,将 指标 变量 移 人 Dependent 栏 , 两 个 因素 都 移入 Fixed Factor(s) 栏 , 单 击 
“Options” 按 钮 ,在 GLM - General Factorial options 对 话 框 中 ,将 Factor(s) and 
Factor 栏 中 的 OVERALL 放 入 Display Means for. 栏 , 选择 Descriptive Statis- 
tics. Estimates of effect size 等 , Ii d;" Continue" f 4H . Mitr“ Plots", 确定 Horizon- 
tal Axis 和 Separate Lines, Jf it; Add, Mifi “Contrasts”, Mt“ OK". 

输出 结 


表 7.5.2 Tests of Between - Subjects Effects{ 各 目标 效应 之 间 的 检验 ) 
Dependent Variable; 











Source Sum of Squares Mean Square 





Varl 
Var2 
Varl * Var2 


Error 








Corrected Total | 
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例 7.5.1 ， 某 养 猪 场 进行 猪 增 重 试验 ,选择 四 个 品种 Ca) 猪 和 三 种 饲料 (0) ,在 
12 种 搭配 中 ,每 种 饲养 一 头 , 饲 养 三 个 月 后 测量 增 重 (=) 数 据 ( 表 7. 5. 3, 见 SPSS 
数据 文件 例 7.5. 1) 








表 7.5.3 









































试 进行 方差 分 析 。 
解 ”建立 SPSS 数据 文件 如 表 7.5.3, 并 如 图 7. 5.1 依次 点 击 。 
Eit dee de Peeters METER are Grohe Quitter ride yalp 


as s| es . sel 


dm Doseriptive Statisties 






， 


ml i I 


Bapression 
Lotlinear 

Chassify 

Data Reduction 
Sene 

Jonpar metrie Teste 


óg55558982DU 





Elžlëlslol~lalnla lol 





弹出 对 话 框 并 填写 相应 选项 ( 见 图 7. 5. 2 一 图 7. 5.4) 。 
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- leperdeni vanabe 


[iswau 
B 























Specty Model 
Ful loctong * Custom 

Esctosk Covanaler Mode 

sn 

FI — oe 


made) | 








Sumo ues [Type 











Univariate: Opti 
Estimated Margnal Means 
Eactorls] and Factor Irterachons 
[VERA 

日 

b ms 

| 

| 

Display 


F Descriptive statistics 
IV. Estimates ot elect size 
T7 Observed power 

fV Parameter esimales 

I Contrast coefficient mati 
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最 后 回 到 图 7. 5. 2 中 点 击 “OK”, 即 输出 以 下 结果 。 


Tests of Between-Subjects Effects 
Dependent Variable; 猪 增 重量 

















































Type III sum Mean Eta 
Source dí F Sig. 
of Squares square Squared 
Corrected Model 342. 750* 5 68. 550 117.514 .000 .990 
Intercept 29700. 750 1 29700. 750 50915. 571 .000 | 1.000 
A 332. 250 3 110, 750 189. 857 .000 .990 
B 10. 500 2 5. 250 9.000 | .016 | .750 
Error 3.500 6 .583 
Total 30047. 000 12 
Corrected Total 346. 250 11 
a R Squared —. 990 (Adjusted R Squared =. 981) ; 
Univariate Tests 
Dependent Variable; 猪 增 重量 
Sum of Mean Eta 
Sig. 
Squares square Squared 
Contrast 332. 250 110. 750 189.857 |.000| .990 
Error 3. 500 .583 

















* The F tests the effect of 猪 品种 This test is based on the linearly independent pairwise 


comparisons among the estimated marginal means 


Univariate Tests 
Dependent Variable; 猪 增 重 量 











Sum of | E Mean Eta 

Squares Qquare Squared 
Contrast 10. 500 2 5.250 9.000 .016 . 750 
Error 3. 500 6 .583 








* The F tests the effect of 饲料 . This test is based on the linearly independent pairwise 


comparisons among the estimated marginal means 


猪 品 种 和 猪 饲料 对 猪 的 增 重 都 有 显著 影响 , 且 品 种 的 影响 比 饲 料 的 影响 更 大 
此 
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$17.5.2 用 两 种 药物 A、B 治疗 缺 铁 性 贫血 12 例 病人 ,服药 一 个 月 后 ,病人 
的 红细胞 增加 数 ( 百 万 /mm ) 数 据 如 下 : 




















表 7.5.4 
药物 B 
不 用 用 
不 用 0.8. 0.9.0.7 0.9, 1.1. 1.0 
药物 A 一 -二 
用 1.3, 1.2, 1.1 2.1, 2.2, 2.0 











试 分 析 ALB 药 对 红细胞 增加 的 作用 以 及 分 析 A 、B 药 之 间 是 否 有 交互 作用 ? 
解 ” 应 用 SPSS 软件 ( 见 SPSS 数据 文件 例 7.5.2) 可 得 : 

表 7.5.5 Descriptive Statistics 
Dependent Variable: 红细胞 增加 数 





Deviation 





物 B 
1 
2 
Total 


药物 A 
1 








.100 


.100 
.MI 
1. 000E— 01 
.100 
.501 
.237 
.609 
.526 











.000 
.900 
.200 







Total 


o o0oo0uwwotu:c 


S 





表 7.5.6 Tests of Between - Subjects Effects 














Dependent Variable: 红细胞 增加 数 
Source |Type II Sum of Squares | df | Mean Square F Sig. 
Corrected Model 2.962 3 .987 | 98.750 | .000 
Intercept 19.507 | 1 19.507 | 1950. 750 | . 000 
A 1.688| 1 | 1.688 | 168.750 | . 000 
B .907 | 1 .907 | 90.750 | .000 
A*B .368| 1 -368 | 36.750 | .000 
Error 8.000E—02| 8 1. 000E—02 
Total 22.550 | 12 
Corrected Total 3.042 | u | 
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从 偏差 平方 和 的 分 解 情况 看 ,总 偏差 平方 和 3. 04 由 两 部 分 构成 :可 解释 的 偏 
差 平方 和 2. 962 和 由 随机 实验 误差 引起 的 残 差 平方 和 0.080, 而 可 解释 的 偏差 平 
方 和 2. 962 由 主 效应 1. 688 十 0. 907 —2. 595 和 交互 效应 0. 368 两 部 分 偏差 平方 和 
构成 。 主 效应 药物 A、B 对 红细胞 增加 户 值 二 0. 01. 影 响 显 著 , 交 互 效应 的 偏差 平 
Ji fi 0.368, 自 由 度 1, 均 方 0.368, 检 验 统计 量 下 值 为 36.750,p 值 近似 为 0. 000, 
显然 在 0. 01 水 平 上 有 显著 意义 ,说 明 交 互 效 应 对 红细胞 增加 有 显著 影响 。 从 各 偏 
差 平 方 和 在 总 偏差 平方 和 中 所 占 的 比例 分 析 ( 等 价 从 下 值 分 析 ) ,药物 A 对 红细胞 
增加 数 的 贡献 最 大 ,疗效 更 显著 一 些 ,药物 B 次 之 .由 于 有 交互 作用 存在 ,两 种 药 
物 同 时 服用 ,效果 更 佳 。 


7.6 协 方差 分 析 


协 方差 分 析 是 消除 混杂 因素 的 影响 后 进行 的 方差 分 析 。 比 如 ,考虑 药物 对 患 
者 某 个 生化 指标 变化 的 影响 ,要 比较 实验 组 与 对 照 组 该 指标 的 变化 均值 是 否 有 显 
著 性 差异 以 确定 药物 的 有 效 性 ,可 能 要 考虑 患者 病程 的 长 短 、 年 龄 以 及 原 指标 水 平 
对 疗效 的 影响 。 要 消除 这 些 因素 的 影响 ,考虑 药物 疗效 , 即 比较 实验 组 与 对 照 组 之 
间 该 生化 指标 变化 量 均值 的 差异 显著 性 , 才 是 科学 的 分 析 方法 。 只 有 在 考虑 了 这 
些 影响 ,在 观测 对 象 的 选择 上 ,使 这 些 条 件 都 一 致 时 , 才 可 以 使 用 一 般 的 方差 分 析 
方法 。 被 消除 的 因素 称 为 协 变量 , 协 变量 是 指 一 些 与 因 变量 、 自 变量 可 能 都 有 关系 
的 连续 性 变量 ,它们 的 存在 可 能 会 影响 分 析 结 果 的 正确 性 ,从 而 不 得 不 在 分 析 中 加 
以 控制 ,这 种 控制 了 协 变量 的 分 析 就 是 协 方差 分 析 。 

例 7.6.1 锅 作 业 工 人 按 暴 露 于 锅 烟 竺 的 年 数 分 为 大 于 等 于 10 年 和 不 足 10 
年 两 组 ,两 组 工人 的 年 龄 未 经 控制 (人 随 着 年 龄 的 增长 ,肺活量 也 会 有 所 下 降 ) 测 量 
了 每 个 工人 的 肺活量 ,研究 暴露 于 锅 粉 尘 中 的 年 龄 与 肺活量 的 关系 ,数据 如 下 表 
(组 别 1 代表 大 于 等 于 10 年 ,组 别 2 代表 不 足 10 年 ), 试 进行 协 方差 分 析 。 

表 7.6.1 








组 别 年 龄 肺活量 “| 组 别 年 龄 肺活量 








4 
39 4. 62 | 
| 
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续 表 7.6.1 
组 别 年 龄 肺活量 组 别 年 龄 肺活量 
1 49 | 5.09 2 | 50 2.70 
1 52 2.07 2 50 3.50 
1 47 4.31 2 45 3.06 
1 61 2.70 2 48 4. 06 
1 65 3.03 2 51 4.51 
1 58 2.78 2 46 4. 66 
1 59 3.67 2 58 2. 88 
2 43 4.61 2 38 3.64 
2 39 4.73 2 38 5.09 

















解 ” 利 用 SPSS 软件 ( 见 SPSS 数据 文件 例 7.6. 1) ,选择 Analyze ,General 
Linear Model、Univariatel ... ,在 激活 的 对 话 框 中 ,把 肺活量 放 入 Dependent 栏 ， 
把 分 组 放 入 Fixed Factor(s) 栏 ,把 年 龄 放 和 人 Covariate(s) 栏 , 单 击 “Option” 按 钮 ， 
选择 Parameter estimates 和 Homogeneity tests, 将 分 组 放 人 Display Means for 
栏 , 单 击 “Continue” 按 钮 ,再 单 击 “OK”, 即 得 到 如 下 成 果 。 

表 7.6.2 Descriptive Statistics 

Dependent Variable: 肺活量 









分 组 Mean N 
1 3. 9492 12 
2 4.1219 16 






4.0479 





37.6.3 Tests of Between-Subjects Effects 
Dependent Variable: 肺活量 























Type III Sum 
Source dí | Mean Square F Sig. 
of Squares 

Corrected Model 11.085 2 5.543 10.073 .001 
Intercept 41. 936 1 41.936 76.216 | .000 
年 龄 10. 881 1 10. 881 19.775 | .000 
.542 1 .542 .985 .330 

分 组 
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续 表 7.6.3 
| df | Mean Square F Sig. 
of Squares 
Error 13. 755 25 .550 
Total 483. 625 28 
Corrected Total 24. 841 27 























表 7. 6.4 Levene's Test of Equality of Error V: 
Dependent Variable; 肺活量 








* Tests the null hypothesis that the error variance of the dependent variable is equal across 
groups; Design: Intercept 十 年 龄 十 分 组 
表 7.6.5 Parameter Estimates 
Dependent Variable. 肺活量 








95% Confidence Interval 

Parameter B Std. Erro] 1 Sig. 

Lower Bound | Upper Bound 
Intercept 7.977 .886 8.998 | .000 6.151 9. 803 

年 龄 —8.700E—02| .020 | 一 4.447 | .000 | 一 .127 |—4.670E—02 

[分 组 =1 .300 .303 .993 | .330 一 .323 .924 
[分 组 =2 0 

二 














This parameter is set to zero because it is redundant 


表 7.6.6 Estimates 
Dependent Variable: 肺活量 























95% Confidence Interval 
分 组 Mean Std. Error 
Lower Bound | Upper Bound 
1 4.219 .223 3.761 4.678 
2 3.919 .191 3.526 4.312 
D Ri a ERN, MEE ULL SCRI MIS Cc 


Evaluated at covariates appeared in the model: 年 龄 = 46.64 


由 此 可 知 , 因 变量 为 肺活量 ,因素 变量 为 组 别 , 协 变量 为 年 龄 ,进行 接触 锅 粉 尘 
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时 间 对 肺活量 影响 的 方差 分 析 时 消除 受 试 者 年 龄 引起 的 肺活量 变化 的 影响 。 由 方 
差分 析 的 结果 可 以 得 出 结论 :肺活量 的 差异 主要 受 试 者 年 龄 差异 所 致 ,与 受 试 者 接 
触 锅 粉 侍 的 时 间 是 否 大 于 10 年 无 关 。 


练习 7 


1. 研究 三 种 伤寒 杆菌 /因素 .控制 变量 ) 对 小 白鼠 存活 天 数 (指标 ,观测 变 
量 ) 有 无 显著 影响 ? 
































c j c i 
1 2 ! " 5 2 n 
2 4 1 n t 2| n 
3 3 1 n 8 2 a 
4 2 1 u 5 2 a 
5 " 1 $ [] | a 
5 7 |o 7 | 5 
7 7 1 7 n ?| 7 
LI 2 1 " 5 2 a 
9 引 1 " 6 2 5 
H 4 1 " 7 3 9» 























2. 比较 四 种 教学 方法 g 的 效果 是否 存 在 明显 差异 ,期 未 统考 后 ,从 这 四 个 
班 各 抽取 5 名 学 生 的 考试 成 绩 : 



































s] 

1 3 
2 3 
3 3 
4 3 
5 3 
6 4 
了 4 
8 4 
s 1 
w 4 

















问 : 四 种 教学 法 的 效果 是 否 存在 显著 差异 ? 哪 两 种 教学 法 间 存 在 显著 差异 ? 
3. 对 下 列 数据 进行 单 因 素 方差 分 析 。 
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1 2 
27 22 
Li 27 
31 25 
29 23 
30 26 
27 27 
28 23 





计算 F 的 观察 值 和 检验 的 概 值 。 比 较 概 值 和 检验 水 平 ,确定 是 否 应 拒绝 原 假 
设 。 对 数据 进行 独立 样本 1 检验。 比较 4 检验 的 概 值 和 下 检验 的 概 值 。 结 果 有 不 


同 吗 ? (a—0. 05) 


4. 新 毕业 的 某 专业 学 生 在 不 同 地 区 就 业 的 起 薪 不 同 ,这 种 情况 看 起 来 很 合 
理 。 从 三 个 地 区 随机 地 选取 了 一 些 用 人 单位 ,要 求 每 个 单位 报告 他 们 付 给 应 届 毕 
业 生 的 起 薪 , 收 集 数 据 如 下 。 采 用 单 因 素 方差 分 析 对 数据 进行 分 析 , 在 a=0. 05 的 
水 平 下 进行 假设 检验 ,并 讨论 分 析 结果 的 意义 。 





地 区 1 地 区 2 地 区 3 
3050 4100 3550 
3150 3950 3350 
3000 3900 3500 
3100 3800 3650 
3150 3950 3600 








5. 下 面 是 SPSS 的 单 因 素 方差 分 析 输 出 结果 ,对 这 些 结果 进行 分 析 , 包 括 处 理 
水 平 数目 ,样本 容量 下 值 ,检验 的 统计 显著 性 。 








ANOVA 
Sani f Square | ab |. Man Square F Sig. 
| 
Between Groups 1701 3 | 567 2.95 0. 040 
Within Groups 11728 6l | 192 
Total 13429 64 | 

















6. 某 化 工 公 司 的 生意 非常 火 。 事 实 上 生意 火 到 公司 的 5 个 车 间 工 人 每 周 工 
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作 时 数 超过 40 个 小 时 。 但 是 ,管理 者 不 清楚 这 5 个 车 间 的 工人 周 工作 时 数 是 否 存 
在 差异 。 从 每 个 车 间 随 机 抽取 样本 ,利用 Excel 对 数据 进行 分 析 , 结 果 如 下 。 解 释 
本 研究 的 设计 ,并 判断 在 二 0.05 的 水 平 下 均值 之 间 是 否 存 在 显著 差异 。 为 什么 
有 差异 或 者 为 什么 没有 差异 ? 均值 各 为 多 少 ? 研究 结果 对 化 工 企 业 来 说 有 什么 
意义 ? 


| 7|398.6368| 56.95| 140.384 | 
Rl 


NE 


hrce of Variation ss| afl us| FlP-vatus| 
| Between Groups| 900.086| 4|225.022| 
| Within Groups|2760.14| 38|72.635: | 
es A E] 

[50m] 


BEER 
17|  Totai[3660.22| 42] 








7. 某 公司 想 对 新 销售 人 员 进 行 不 同 的 销售 培训 ,为 了 比较 培训 课程 的 有 效 
性 ,随机 选择 了 三 组 销售 人 员 ,每 组 5 人 。 一 组 接受 A 课程 销售 培训 ,一 组 接受 B 
课程 销售 培训 , 另 一 组 C 没有 参与 任何 训练 。 当 前 两 组 的 训练 课程 结束 时 ,收集 
训练 后 两 个 星期 内 的 各 组 销售 人 员 的 销售 记录 如 下 : 

















三 组 销售 人 员 销 售 业 绩 
和 A 课程 B 课程 C 
——— 2088 3339 2228 
2176 2777 2578 
3445 | 3020 TE 1227 
2517 2437 2044 
944 3067 1681 











判断 在 显著 性 水 平 为 0. 1 的 条 件 下 是 否 有 理由 证 明 三 组 销售 人 员 的 销售 水 平 有 所 


第 7 章 方差 与 协 方差 分 析 195 





不 同 。 

8. 一 个 大 型 汽车 制造 商 希 望 了 解 四 种 品牌 的 轮胎 (A,B,C FL DO PES H EE 
数 是 否 存在 差异 ,因为 该 制造 商 想 根据 轮胎 的 耐用 性 来 选择 最 好 的 供应 商 。 供 应 
商 从 每 家 公司 选择 了 等 级 相同 的 轮胎 ,并 在 同等 汽车 上 进行 了 检验 。 里 程 数 如 下 : 


T 
A | B ] C D 











31000 24000 30500 24500 
25000 25500 28000 | 27000 
28500 27000 32500 26000 
29000 26500 28000 21000 
32000 25000 31000 25500 
27500 28000 26000 


27500 








在 a 二 0.05 下 检验 四 种 品牌 的 平均 里 程 数 是 否 存在 显著 差异 ,假定 轮胎 里 程 
数 服从 正 态 分 布 。 

9. 建筑 工人 委员 会 列 出 许多 建筑 工种 ,这 些 工 种 向 工人 支付 的 小 时 工资 大 体 
相当 。 其 中 包括 砌 砖 . 铁 工 和 起 重 机 驾驶 。 假 定 一 个 研究 人 员 在 全 国 范围 内 从 这 
三 个 建筑 工种 中 随机 抽取 了 一 个 样本 ,询问 工人 的 小 时 工资 。 假 定 调查 获得 的 数 
据 如 下 ,这 三 个 建筑 工种 的 小 时 工资 有 显著 差异 吗 ? 如 果 有 显著 差异 ,请 利用 多 重 
比较 程序 判断 哪些 工种 之 间 存 在 显著 差异 ,a 二 0. 05。 





[3 铁 工 起 重 机 驾驶 
19. 25 26.45 16.20 
17. 80 | 21.10 | 23.30 
20. 50 16.40 22.90 
24.33 22.86 | 19.50 
19.81 25.55 | 27.00 
22.29 18.50 22.95 
21.20 | 25.52 


10. 随 着 计算 机 技术 的 发 展 ,对 键盘 的 要 求 愈 发 严格 。 某 公司 要 研究 现 有 键 
盘 设 计 是 否 影响 打字 员 的 速度 , 现 随机 选择 5 名 打字 员 ,每 个 打字 员 用 三 种 键盘 进 
行 测试 (每 分 钟 打字 个 数 ) 。 
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打字 员 键盘 A HB 键盘 C 
1 51 57 72 
2 109 112 117 
3 47 43 51 
4 98 98 107 
5 70 69 77 





11. 某 企业 准备 上 市 一 种 新 型 香水 ,需要 进行 市 场 调研 。 除 香水 气味 外 ,经 验 
表明 香水 包装 与 广告 策略 对 销售 量 的 增长 也 有 很 大 影响 。 现 用 三 个 不 同 的 广告 策 
略 和 三 种 不 同 的 包装 对 这 种 香水 进行 测试 ,每 种 组 合 采用 两 个 不 同 的 市 场 调查 , 调 
查 结束 后 ,数据 如 下 : 


























各 种 促销 手段 下 的 销售 量 增长 速度 

广告 策略 i 
mee DI 激情 流行 
2.8 2.04 1.58 
2.73 1.33 1.26 

? 3.29 1.5 1 
2.68 1.4 1.82 
] 2.54 3.15 1.92 
i 2.59 2.88 1.33 








根据 这 些 数据 ,希望 能 找 出 最 佳 的 促销 模式 。 

12. 某 商场 有 销售 数据 ( 见 SPSS 数据 文件 习题 7. 12) 。 研 究 销售 额 是 否 受 到 
促销 方式 .售后 服务 .奖金 的 影响 ? 以 及 受到 怎样 的 影响 ? 

COD 进行 不 考虑 交互 效应 和 协 变量 (奖金 ) 的 方差 分 析 ; 

(2) 进行 考虑 交互 作用 但 不 考虑 协 变量 的 方差 分 析 ; 

(3) 进行 方差 分 析 。 

13. 计算 下 面 的 方差 分 析 表 。 确 定 检验 的 显著 性 ( 即 计算 检验 的 概 值 ), 并 对 
各 效应 的 假设 进行 判断 。c 一 0. 05. 








方差 来 源 SS df Ms | F | se 
行 1.047 1 

列 3. 844 3 

交互 效应 0.773 

误差 


总 和 12.632 23 
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14. 考虑 四 台 机 器 在 三 个 不 同 的 班次 所 生产 出 的 阀门 直径 ,质量 控制 员 和 希望 
了 解 班次 或 机 器 对 阀门 平均 直径 是 否 有 影响 。 按照 机 器 和 班次 排列 的 数据 如 下 
表 。 此 外 ,利用 SPSS 对 数据 进行 双 因素 方差 分 析 。 该 问题 的 假设 是 什么 ? 对答 
出 结果 进行 显著 性 检验 。 讨 论 所 得 到 的 结果 。 质 量 控制 员 从 中 能 得 到 什么 结论 ? 



































阀门 直径 Ccm) 
班次 
1 2 3 
i 6.56 6.38 6.29 
6.40 6.19 6.23 
f 6.54 6. 26 6.19 
6.34 6.23 6.33 
机 器 
6.58 6.22 6. 26 
6.44 6.27 6.31 
i 6. 36 6.29 6.21 
6.50 6.19 6.58 


Tests of Between-Subjects Effects 
Dependent Variable; 直径 (cm) 





Type III Sum 
Source df | Mean Square F Sig. 
of Squares 
Corrected Model .233* 1 [ .021 1. 604 .214 
Intercept 964. 568 1 964. 568 73050.245 | . 000 
JQ . 005 3 .002 .136 | .937 
BC .197 2 .099 7.471 | .008 
JQ * BC .030 6 .005 .383 | .876 
Error .158 12 .013 
Total 964. 959 24 
Corrected Total .391 23 | 




















a R Squared = .595 (Adjusted R Squared = .224) 


第 8 章 ”相关 与 回归 分 析 


在 实际 问题 的 研究 中 , 互 有 联系 的 变量 间 关 系 的 紧密 程度 各 不 相同 。 一 种 极 
端的 情况 是 一 个 ( 些 ) 变 量 的 变化 能 完全 决定 另 一 个 ( 些 ) 变 量 的 变化 ,变量 间 完 全 
表现 为 一 种 确定 性 关系 , 即 函 数 关系 ; 另 一 种 普遍 的 情况 是 变量 间 有 着 密切 的 联 
系 ,但 它们 并 没有 密切 到 由 一 个 ( 些 ) 可 以 完全 确定 另 一 个 ( 些 ) 的 程度 ,它们 是 一 种 
非 确定 性 关系 , 即 统计 关系 。 在 现代 统计 学 中 关于 统计 关系 的 研究 已 成 为 统计 学 
中 两 个 重要 的 分 支 ,它们 叫 相关 分 析 和 回归 分 析 。 在 应 用 中 ,这 两 种 统计 分 析 方法 
经 常 相互 结合 和 渗透 ,但 它们 研究 的 侧重 点 和 应 用 面 不 同 , 使 得 它们 的 研究 方法 也 
大 不 相同 。 

变量 的 统计 关系 在 现实 中 普遍 存在 ,就 个 别 例子 而 言 ,统计 关系 有 不 确定 性 或 
随机 性 ,但 大 量 观测 后 会 发 现 ,统计 关系 又 具有 一 定 的 规律 性 ,这 种 规律 性 的 描写 
或 者 刻画 就 是 相关 分 析 要 解决 的 问题 。 相 关 分 析 着 重 研 究 变量 之 间 统 计 关系 的 密 
切 程度 ,一 般 用 相关 系数 来 度量 。 

回归 分 析 (regression analysis) 是 根据 变量 观测 数据 分 析 变 量 间 关系 的 最 常用 
的 统计 分 析 方 法 ,其 主要 任务 是 根据 变量 的 观测 数据 定量 地 建立 所 关注 的 变量 和 
影响 它 变 化 的 变量 之 间 的 数学 关系 式 ,检验 影响 变量 的 显著 程度 和 比较 它们 的 作 
用 大 小 ,进而 用 一 组 变量 的 变化 解释 和 预测 另 一 个 变量 的 变化 。 通 常 把 变量 观测 
数据 称 为 样本 。 如 果 数 学 关系 式 描写 了 一 个 变量 与 另 一 个 变量 之 间 的 关系 , 则 称 
其 为 一 元 回归 分 析 ; 如 果 数 学 关系 式 描写 了 一 个 变量 与 男 多 个 变量 之 间 的 关系 , 则 
称 其 为 多 元 回归 分 析 , 并 且 称 这 一 个 变量 是 被 影响 变量 即 因 变量 (dependent Vari- 
able) , 称 这 多 个 变量 是 影响 变量 , 即 自 变量 (independent Variable) 。 线 性 回归 分 析 
是 描述 变量 间 统 计 关 系 的 一 种 最 重要 的 统计 模型 技术 ,本 章 将 着 重 介 绍 它 的 建 模 
原理 ,模型 参数 的 最 小 二 乘 估计 ,回归 方程 的 有 关 检 验 和 回归 模型 的 应 用 。 


8.1 两 个 变量 的 相关 分 析 


在 第 4 章 中 ,两 个 随机 变量 X, Y 的 相关 系数 定义 为 
a tA Y) 
PU VOD. J 





4 
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对 X 的 观测 值 s xe xz。，, 对 Y 的 观测 值 y，，> ，…，w，, 则 可 得 到 样本 相关 
系数 为 


3G;—-2Y9,—») 


[Ba [Zo 


此 相关 系数 也 称 为 皮尔 逊 (Pearson) 相 关系 数 。 皮 尔 逊 相关 系数 只 能 描写 两 个 随 
机 变量 之 间 线 性 相关 程度 的 强 弱 , 其 取 值 范围 是 [一 1, 1], 绝 对 值 越 接近 1 ,关系 越 
密切 ,绝对 值 越 接近 0, 关 系 越 疏 远 。 其 取 值 大 于 零 , 称 为 正 相关 ; 取 值 小 于 零 , 称 
为 负 相 关 ; 取 值 等 于 零 , 称 为 不 相关 。 在 理论 上 也 可 以 证 明 ,r 是 p 的 相合 估计 。 

在 实际 应 用 中 ,如 何 度量 “绝对 值 接近 1 "的 接近 程度 呢 ? 作 统 计 分 析 有 这 样 
一 个 术语 :在 水 平 下 X,Y 线 性 关系 显著 , 即 X,Y 都 服从 正 态 分 布 ,p==0 时 采用 
(检验 来 确定 -的 显著 性 。 


记 :(z 一 2) 为 服从 自由 度 为 — 2 的 :分 布 的 随机 变量 ,统计 量 (一 一 二 
Je 
p72PGG-2)7 |, [L4 O12) OR pa WKH 在 统计 上 是 显著 的 
Co 与 零 存在 显著 差异 ) , 即 在 水平 下 X,Y 线性 关系 显著 ;和 否则 表明 ~ 在 统计 上 
是 不 显著 的 , 即 在 水 平 下 X, Y 线性 关系 不 显著 。 
皮尔 逊 相关 系数 仅 适用 于 度量 定 距 变量 (或 定 比 变量 ) ,下面 介 绍 一 种 可 度量 
定 类 变量 或 定 序 变量 的 相关 系数 , 即 斯 皮尔 曼 (Spearman) 等 级 相关 系数 。 同 时 ， 
它 也 可 以 度量 非 线性 相关 关系 。 斯 皮尔 曼 等 级 相关 系数 定义 为 


r= 











其 中 ,zi， yi 分 别 是 两 个 变量 X,Y 的 观测 值 分 别 按 大 小 (或 按 优 劣 等 ) 排 位 的 
等 级 ( 称 为 秩 ) ,n 为 样本 容量 。 与 皮尔 逊 相关 系数 类 似 , 其 取 值 范围 是 [一 1，1]， 
绝对 值 越 接近 1 ,关系 越 密切 ,绝对 值 越 接近 0, 关 系 越 疏远 。 其 取 值 大 于 零 , 称 为 
正 相关 ; 取 值 小 于 零 , 称 为 负 相关 ; 取 值 等 于 零 , 称 为 不 相关 。 

X,Y 是 否 存在 显著 的 等 级 相关 也 需要 进行 检验 。 当 020 时 ,可 以 利用 以 下 
统计 量 进行 等 级 相关 系数 的 显著 性 检验 。 


n—2 
$e, 3-8 


? [e| 2742 (12) 8& p—2PGGC-2)77 |t) a BE RH X,Y 存 在 显著 的 等 级 
相关 。 
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皮尔 逊 相关 系数 和 斯 皮尔 曼 等 级 相关 系数 都 由 SPSS 容易 得 到 。 
例 8.1.1 某 公司 下 属 15 个 分 公司 ,它们 的 销售 额 zx( 万 元 ) ,广告 费 y( 万 
元 ) .销售 人 员 x( 个 ) 数 据 如 下 表 8. 1. 1。 





表 8.1.1 
bianhao x] y | = 

NE 1 7800 21 19 
2 2 8400 19 20 
了 3 6100 18 20 
也 4 5200 15 15 
5| 5 9700 21 21 
E| 6 8900 20 19 
7 Y 10000 2 2 
8] 8 9300 24 24 
a] 9 6500 15 15 
10 10 730 19 18 
1 "n 4800 13 12 
a2] 12 4500 n 12 
13 13 6700 18 18 
Tj 14 7500 20 19 
Bj 15 9500 15 25 





试 研究 销售 额 zx( 万 元 ) .广告 费 y( 万 元 )、 销 售 人 员 (个 ) 之 间 的 相关 关系 。 
解 ”首先 建立 SPSS 数据 文件 ( 见 SPSS 数据 文件 例 8. 1. D ,调用 相关 分 析 程 
序 ( 图 8.1.1)。 











larm | | i, Reports LI | 
as 3- |] Jk Descriptive Statisties — Blo 
Tables ,| 
bianhao x Compare Means , 
"4l 1 7000 ^ General Linear Model , 
2 2 8400 , Mixed Models » 
3 3 6100 y 
ri 4 op Beession E Partial 
Tz] Loglinear ， Distances.. 
43 : iam Classify 下 天 一 
二 Data Reduction ， 
Ji 7 10000 Scale >» 
图 8.1.1 


填写 对 话 框 ( 见 图 8. 1. 2) ,点击 “OK”, 即 得 到 表 8.1.2 和 表 8. 1. 3 结果 。 
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T 


PEERAA) 四 
IER CIE) y Paste. 





Correlation Coefficients 
IV Pearson I Kendalstaub I7 Speaman 
Test of Significance 
G Iwotaled C Dnetaled 
[V Flag significant correlations _opiom- | 


Æ 8.1.2 


表 8.1.2 Correlations 























销售 额 广告 费 销售 人 员 
(万 元 ) (万 元 ) (个 ) 
Pearson Correlation 1 766 .884 
销售 
Sig. (2-tailed) 2 .001 .000 
(万 元 ) 
N 15 15 15 
告 费 Pearson Correlation .T66'* 1 4718" * 
kd Sig. (2-tailed) .001 .003 
(万 元 ) 
N 15 15 15 
T 
销售 人 员 Pearson Correlation .884'* T718** 1 
Sig. (2-tailed) .000 .003 ^ 
(个 ) 
N 15 | 15 15 





* Correlation is significant at the 0. 01 level (2-tailed) 


由 此 表 可 知 :销售 额 x 万 元 与 广告 费 y 万 元 的 皮尔 逊 相关 系数 为 0. 766 , 概 值 
为 0.001; 销 售 额 z 万 元 与 销售 人 员 x 个 的 皮尔 逊 相关 系数 为 0.884, 概 值 为 1. 206 
X10 5,774538 y 万 元 与 销售 人 员 z 个 的 皮尔 逊 相关 系数 为 0.718, 概 值 为 0. 003, 
在 水 平 0.01 下 均 有 统计 显著 性 。 
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表 8.1.3 Correlations 


























销售 额 广告 费 | 销售 人 员 
(万 元 ) (万 元 ) (个 ) 
销售 额 [Correlation Coefficient| 1.000 | .7757* | .867'* 
(万 元 ) Sig. (2-tailed) t .001 .000 
N 15 15 15 
广告 费 |Correlation Coefficient! | 775* - 1.000 .661** 
Spearman's rho (万 元 ) Sig. (2-tailed) .001 .007 
N 15 15 15 
Correlation Coefficient| .867… .661'* 1.000 
销售 人 员 P d 
Sig. (2-tailed) . 000 . 007 $ 
[09] 
N 15 15 15 





* Correlation is significant at the 0, 01 level (2-tailed) 


由 此 表 可 知 : 销 售 额 x 万 元 与 广告 费 y 万 元 的 斯 皮尔 曼 等 级 相关 系数 为 
0.775, 概 值 为 0.001; 销售 额 r 万 元 与 销售 人 员 z 个 的 斯 皮尔 曼 等 级 相关 系数 为 
0.867, 概 值 为 2.873X10“; 广告 费 y 万 元 与 销售 人 员 x 个 的 斯 皮尔 曼 等 级 相关 
系数 为 0.661, 概 值 为 0.007, 在 水 平 0.01 下 均 有 统计 显著 性 。 

在 多 变量 的 情况 下 ,变量 之 间 的 相关 关系 很 复杂 。 因 此 除了 考虑 两 个 变量 的 
相关 系数 外 ,还 要 研究 在 控制 其 余 变 量 情况 下 两 个 变量 间 的 偏 相关 系数 ,研究 一 个 
变量 与 一 组 变量 的 线性 相关 性 的 复 相关 系数 (或 全 相关 系数 ), 以 及 研究 一 组 变量 
与 另 一 组 变量 线性 相关 性 的 典型 相关 系数 。 偏 相关 系数 和 复 相关 系数 在 随后 几 节 
介绍 ,而 典型 相关 系数 请 阅读 相关 书籍 。 


8.2 一 元 回归 分 析 


在 科学 研究 中 ,经 常 要 涉及 变量 间 的 各 种 关系 。 比 如 ,需求 与 价格 、 成 本 与 产 
量 、 利 润 与 价格 、 销 售 量 等 等 。 如 果 变量 y 与 x 间 的 关系 可 由 方程 y 二 a 十 bz 来 描 
述 , 其 中 4a, 5b 均 为 常数 ,那么 y 与 x 间 的 关系 是 确定 性 的 , 即 对 于 每 个 变量 值 z 都 
只 与 某 一 个 变量 值 y 相对 应 。 例 如 ,菜市 场 在 1 时 刻 黄瓜 销量 的 数据 如 下 (其 中 q 
表示 上 时 刻 销售 黄瓜 的 数量 ,单位 : 斤 ,p, 表示 上 时 刻 的 销售 价格 ,单位 :元 ): 
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表 8.2.1 
b. q 
2.5 1 
2.0 3 
1.5 5 
1.0 7 
0.5 9 
0 11 








这 些 结果 可 以 用 一 个 方程 的 形式 概括 为 % 二 11 一 4p, 这 是 一 个 确定 性 关系 ， 
因为 对 于 每 个 价格 ,总 有 一 个 相应 黄瓜 售 出 量 。 如 果 对 于 任何 已 知 的 工 值 ,变量 y 
可 以 某 个 概率 取 某 些 特 殊 的 值 , 则 +、y 之 间 的 关系 是 随机 的 ,例如 

















表 8.2.2 
bi q 概率 
0 0.25 
2.5 1 0. 50 
2 0. 25 
T^ 
2 0.25 
2.0 3 0.50 
4 0. 25 
10 0.25 
0 11 0. 50 
12 0.25 











这 时 ,方程 的 形式 为 g. 一 11 一 4 十 se 式 中 se, 是 一 个 具有 分 布 


表 8.2.3 
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的 随机 变量 , 称 为 随机 扰动 或 随机 误差 项 。 由 于 随机 扰动 的 存在 ,对 于 每 一 价格 ， 
有 几 个 销售 量 与 之 对 应 ,而 每 一 销售 量 的 发 生 都 具有 某 个 确定 的 概率 ,所 以 ,后 一 
种 关系 是 随机 的 。 

在 回归 分 析 中 ,我 们 研究 变量 的 随机 性 关系 。 其 中 最 简单 的 是 两 个 变量 之 间 
的 线性 关系 ,其 回归 模型 为 

yi abr, +e; 

式 中 y 称 为 因 变 量 ,x 称 为 自 变量 ,e 称 为 随机 扰动 ,a, b 称 为 待 估计 的 回归 参数 ， 
下 标 i 表示 第 i 个 观测 值 。 

对 于 回归 模型 ,我 们 假设 

& —NO, o6), i=l, 2, n 

Elee)) —0,izj 





这 时 可 得 到 

yc NGabz;, o^) 
于 是 , 当 z=0 时 ,y 的 平均 值 为 a; 当 x 取 值 发 生变 化 时 ,y 的 平均 值 变 化 b。 例 
如 ,y 表示 总 消费 ,zx 表示 总 收入 , 则 a 表示 消费 的 维持 生活 水 平 ,b 则 表示 边际 消 
费 倾 向 。 如 果 给 出 a 和 6 的 估计 量 分 别 为 4a, b, 则 经 验 回归 方程 为 

yi=at+bx; 

一 般 地 ,y 的 值 分 布 在 y,; 为 中 心 的 周围 ,它们 之 间 的 差 称 为 残 差 ,用 。 表示 , 即 
esy y BUT as b 不 同 于 a,b 的 真 值 ,e; 与 e 是 不 相同 的 。 实 际 上 , 残 差 e 可 
视 为 扰动 se, 的 “估计 量 ”。 


8.3 回归 系数 的 最 小 二 乘 估计 


设 对 > 及 z 作 n 次 观测 得 n 组 数据 (y,， zx), i 二 1, 2,…, nn, 应 用 计算 机 软件 
Excel 做 散 点 图 , 当 散 点 振 直线 趋势 时 ,我 们 认为 y 与 + 的 关系 可 用 一 元 回归 模型 
来 描述 。 根 据 最 小 二 乘 原理 , 即 让 离 差 平方 和 达到 最 小 的 原则 求解 回归 系数 a,5 
的 估计 量 &，2，, 即 

minQ(a,b) = min —E( = min —a-— hr) 
HT Qa, b)H ab 的 二 次 非 负 函 数 ， 其 最 小 值 存在 ， 根据 微 积分 求 极 值 的 方法 ， 
a b 应 满足 =0, 


容易 解 出 
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其 中 工 = 工 > r, y= 15y, ka Siw = ia 
£ es ei 


ni ia 





例 8.3.1 某 市 场 连续 12 天 卖 出 黄瓜 的 价格 和 数量 的 调查 数据 如 下 。 








表 8.3.1 
价格 (元 / 斤 ) 销量 w( 斤 ) 
1. 00 55 
0.90 70 
0. 80 90 
0.70 100 
0.70 90 
0.70 105 
0.70 80 
0.65 110 
0. 60 125 
0.60 115 
0.55 130 
0.50 130 





试 求 :黄瓜 销量 对 价格 的 回归 方程 (regression equation) 。 
解 ”打开 SPSS, 建 立 数据 文件 ( 见 SPSS 数据 文件 例 8. 3. 1) 


表 8.3.2 





BPHESRIdsddesss 


调用 线性 回归 程序 : 单 击 Analyze— Regression Linear, 打开 线 性 回归 对 话 
框 。 在 左 侧 源 变 量 栏 中 选择 因 变量 y( 销 量 ) 进 入 Dependent 栏 中 ,选择 自 变量 x 
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(价格 ) 进 入 Independent 栏 中 。 单 击 “Statistics” 按 钮 ,在 对 话 框 中 可 选择 :回归 系 
数 的 置信 区 间 (confidence Intervals) ,描述 性 统计 (descriptives) , 单 击 “Continue” 
一 “OK” 按 钮 , 便 得 到 程序 “默认 选择 项 ”的 结果 。 


表 8.3.3 Descriptive Statistics 








| Mean | Std. Deviation N 
销量 | 100. 00 23. 932 12 
价格 .7000 .14302 12 


38.3.4 Correlations 


| 销量 价格 





Pearson Correlation 销量 | 1.000 —.943 
Sig. (1-tailed) 价格 一 .943 1. 000 








表 8.3.5 Coefficients * 





Unstandardized Standardized 


Model Coefficients Coefficients t Sig. 





B Std. Error Beta 





1 (Constant) | 210.444 | 12.571 16. 741 . 000 
价格 一 157.778| 17. 624 一 .943 一 8. 952 .000 























a Dependent Variable; 销量 
可 得 经 验 回归 方程 为 
5,7210. 444—157. 778x; 
这 就 是 我 们 要 估计 的 需求 函数 。 由 于 是 线性 函数 ,需求 的 价格 弹性 随 价格 的 不 同 
而 变化 ,在 平均 价格 (zx, 二 0.7) 这 一 点 上 ,价格 弹性 了 的 估计 量 为 
0,727: — 157. 778 X0. 007 — — 1.104 
这 说 明 需 求 在 这 一 点 具有 较 小 的 弹性 。 
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8.4 回归 估计 的 统计 推断 


上 一 节 , 我 们 在 最 小 二 乘 意 义 下 推导 了 回归 参数 的 估计 式 以 及 SPSS 的 实现 ， 
下 面 要 进一步 探讨 经 典 正 态 线性 回归 模型 中 其 估计 式 的 其 它 特征 以 及 统计 推断 。 


1. 可 以 证 明 


(1) 估 计量 4,6 分 别 是 a b 的 无 偏 估 计量 ; 


(2)var(é) =o cer » var(b) - £-, 


(3) 由 于 4,2 均 为 相互 独立 正 态 变量 >，，>y ,…，>w， 的 线性 组 合 ,根据 正 态 分 
布 的 性 质 ,它们 也 一 定 是 正 态 的 。 


2. 从 回归 估计 量 (regression estimator) 的 方差 可 以 看 到 


MDR e, 的 方差 o* 越 大 ,a. 的 方差 也 越 大 ,这 意味 着 围绕 总 体 回归 直线 的 
扰动 离 差 越 大 .我 们 所 估计 的 参数 的 离 差 也 越 大 ,如 果 所 有 扰动 为 零 ,那么 关于 回 
归 参 数 的 估计 量 就 和 它们 的 真 值 一 致 ; 

(2) 自 变量 x 的 值 越 分 散 ,a, b 的 方差 越 小 , 当 
差 变 成 无 穷 大 ,这 表明 r 的 离 差 越 大 ,Lv 也 越 大 ,a, 5 就 越 接近 于 a,b 的 真 值 ; 

(3) 当 工 =0(4, 关 0) 时 ,a 的 方差 最 小 。 

如 上 对 自 变 量 值 的 选择 ,通常 是 不 可 能 的 ,因为 我 们 只 能 在 别人 抽样 结果 的 基 
础 上 来 工作 。 


3. 总 体 方差 的 一 个 无 偏 估计 量 是 





Lo- = 
H s RE ,我 们 可 以 得 到 3 stet ton 











义 后 我 们 把 这 两 个 无 偏 估计 量 的 算术 平方 根 分 别称 " 4a 忆 的 估计 标准 误差 。 
4.4 和 2 的 区 间 估 计 
置信 水 平 为 1 一 的 区 间 估 计 是 
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(a — tg a Si a eS 
Ó — ts aS bb tg sS 


5.E(y;) 的 区 间 估 计 


因为 总 体 回归 直线 为 EC) 一 a 十 hz,, 而 它 的 估计 式 为 一 4 十 be, 又 EG) = 
abr, =E) ,所 以 六 =& 十 bz, 是 ECy,) 的 一 个 无 偏 估计 量 。 为 了 对 EO 
ja 
区 间 估计 ,我 们 首先 可 求 出 S, ma Hb, 的 方差 性 =o (Lo 39) xps 
"(i 2 rtg] GR 
NEG), é) tig Si =S (Lee 
得 EO ) 的 置信 水 平 为 1 一 “ 的 区 间 估计 是 
OiT tg. ri Ss s ots uS) 


6. y 的 样本 变 差 的 分 解 


MEH 2) ,这样 便 可 


易 见 DoI = DaDo 
离 差 平 方 和 回归 平方 和 残 差 平方 和 
这 样 ,y 的 样本 变 差 (SST) 就 分 解 为 两 部 分 ,一 部 分 是 回归 平方 和 (SSR) 反 映 了 回 
归 自 变量 变 差 的 贡献 , 另 一 部 分 残 差 平方 和 (SSE) 反 映 了 误差 的 影响 。 由 于 
SST=SSR 十 SSE, 记 R* 二 SSR/SST, 则 R^ 度量 了 经 验 回 归 方 程 对 观测 数据 的 拟 
合 程 度 , 称 之 为 判定 系数 。 显 然 0<R* 过 1,R? 是 因 变 量 与 自 变量 相关 系数 的 平方 。 
因此 , 它 的 值 越 大 ,表明 因 变 量 与 自 变量 之 间 的 相关 性 就 越 强 。 


7. 回归 方程 的 显著 性 检验 


前 面 我 们 解决 了 简单 回归 模型 的 参数 估计 问题 ,并 给 出 了 一 元 线性 经 验 回 归 
方程 ,然而 所 得 回归 方程 代表 性 究竟 如 何 ? 即 自 变 量 与 因 变 量 之 间 是 否 真正 具有 
线性 关系 ? 所 以 必须 进行 显著 性 检验 (significance test) , 即 评价 所 建立 的 回归 方程 
是 否 有 显著 意义 。 如 果 回 归 方 程 无 显著 意义 ,那么 其 自 变量 前 的 系数 可 以 取 值 为 
零 , 反 之 就 不 能 取 值 零 。 所 以 ,这 时 原 假设 和 备 择 假设 可 以 这 样 来 提出 

:b=0 H; :b#0 


要 检验 Ho ,我 们 在 经 典 正 态 回归 模型 下 ,构成 检验 统计 量 z=- 





。 在 H, F, 


Sé ~en 2) FAEN ador a, 4 P{t(n—2)>|Z]|}<a 时 ,就 拒绝 
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H ,认为 回归 方程 上 有 显著 意义 。 另 外 ,注意 到 在 因 变 量 的 样本 变 差分 解 中 ,SST 一 
SSR--SSE—/! L, 十 SSE, 若 Ho 成立, 则 SSR—0,SST—SSE ,这 样 因 变量 的 变 差 全 


N = SSR/1 zt 
部 由 于 随机 误差 所 致 ,我 们 可 构成 检验 统计 量 F= s PEA, n 一 2) 


二 忆 一 时 ,就 拒绝 H。, 认 为 回归 方程 有 显著 意义 。 如 上 两 种 检验 结果 是 相同 的 ， 
而 后 一 种 检验 可 用 于 多 个 自 变量 的 情况 。 


8. 回归 分 析 的 表述 


我 们 从 一 组 样本 数据 进行 回归 系数 的 估计 ,得 到 经 验 回 归 方 程 ,因为 还 要 进行 
区 间 估 计 、 显 著 性 检验 ,所 以 必须 求 出 回归 估计 量 的 标准 误 S;，S; ,以 及 判定 系数 
R* ,通常 可 写成 表达 式 : 
y=atbz,R’ = … 
€. oco d 
其 中 括号 内 填写 相应 的 :一 检验 显著 性 概率 值 。 这 样 就 较 全 面 地 表述 了 样本 回归 
估计 式 。 
例 8.4.1 对 于 例 8. 3. 1 黄瓜 需求 问题 ,我 们 应 用 SPSS( 见 SPSS 数据 文件 例 
8. 3. 1) 可 得 下 面 成 果 : 
表 8.4.1 Model Summary 


Model R R Square | Adjusted R Square | Std. Error of the Estimate 








1 .943* .889 .878 8. 360 
a Predictors; (Constant)， 价 格 


表 8.4.2 ANOVA" 


Sum of 
Model df Mean Square F Sig. 
Squares 













1 Regression 5601. 111 5601. 111 | 80. 143 . 000* 





Residual 698. 889 69. 889 





Total 6300. 000 








a Predictors: (Constan) ,价格 
b Dependent Variable: 销量 
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389 8.4.3 Coefficients * 

















Unstandardized Standardized| 95% Confidence 
Coefficients Coefficients Interval for B 
Model 1 | Sig. 
Lower Upper 
B Std. Error Beta 

Bound Bound 

1 Constant | 210. 444 12. 571 16.741| .000 | 182. 435 | 238. 454 
价格 一 157.778| 17.624 —.943 |—8.954 .000 | 一 197.047| 一 118. 508 


























a Dependent Variable; 销量 
由 此 可 知 : 

(1) Rè= 0.889, S = 8.360 = (698. 889/10)":, 平方 和 分 解 SST= 6300 = 
5601. 1114-698, 889 —SSR-- SSE, S; —12. 571, S, — 17. 624, 这 表明 因 变 量 的 样本 
变 差 的 88.9% 是 拟 合 所 产生 的 , 即 由 y 对 y 的 拟 合 。R: 也 表明 了 样本 回归 直线 
对 观测 值 的 拟 合 相 当 好 ; 

(2) 回 归 方 程 的 显著 性 检验 ,从 : -检验 和 下 -检验 均 有 显著 性 概率 值 p= 
4. 34E—06<0. 05 ,所 以 认为 回归 方程 是 显著 的 ， 

(3)a 的 9526 置信 区 间 是 (182. 435, 238. 454). b 的 95% 置信 区 间 是 
(—197.047, —118. 508) 

(4) 最 后 可 写 出 经 验 回归 方程 

3,7 210.444 — 157. 778r, 
(1.21E—08) (4. 34E— 06) 

下 面 我 们 求 ECy,) 的 95% 置 信 区 间 。 

在 回归 分 析 主 对 话 框 中 , 单 击 保存 新 变量 按钮 “Save” ,将 选择 的 新 变量 保存 在 
数据 文件 中 ,在 对 话 框 中 可 选择 :未 标准 化 预测 值 (Unstandardized) ,对 平均 ,个体 
的 预测 区 间 (Prediction Individual) 等 , 即 得 到 : 








表 8.4.4 
x poo pui | wa met iet det 
T 3m — —— — sump S e D E 
J 四 m ç Suu sams PEM ISEN WWB 
J o æ uzm ræ wm eao 1040087 
本 m 四 imamm stszal 13719 oes 11938775 
T mœ œ sna stsza 5779 6I25 11938775 
TE mæ sS mom saem sam e0625 11938775 
Ado» 3OOXXO saez — "083719 806125 119.38775 
T æ to e aeaa naeia 684019 127.37581 
本 œ os nsa BN 12243620. 9599633 135.55923 
x| æ ns 1577778 18M9 122484 95963 13555923 
T S 130 1236667 156900 13164233 10340385 14392949 
W| — 5 — w sm 207E oa NOBa 1524739 
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从 表 8.4.4 中 ,Lmci-1 是 E(y,) 的 置信 下 限 ,Uici-1 是 E(y;) 的 置信 上 限 。 
8.5 预 测 
我 们 建立 了 回归 方程 后 ,其 重要 应 用 之 一 就 是 用 来 进行 预测 。 


1. 预测 值 (prediction value) 


已 知 自 变量 z 的 值 x,, 预测 因 变量 y 的 相应 值 y, .由 于 yo 二 a 十 bzxo 十 eo 是 一 
个 散布 在 总 体 回 归 直 线 周 围 对 应 于 ro 点 的 随机 变量 ,所 以 实验 前 我 们 还 不 能 知道 
它 的 取 值 ,但 可 得 到 其 预测 值 y 二 a 十 bx。。 

例 8.5.1 对 于 例 8.3.1. 预 测 当 价格 分 别 为 1.2 ,1.1 40.85 .0.75 ,0.45 
时 ,黄瓜 的 销量 情况 。 

解 ” 打 开 SPSS 建立 的 数据 文件 ,将 新 价格 填 人 数据 文件 中 ( 见 SPSS 数据 文 
件 例 8.5. D ,并 在 主 对 话 框 的 保存 对 话 框 中 选 “ 未 标准 化 预测 ”和 "个 体 区 间 预 
测 ”, 运 行 即 得 : 

表 8.5.1 





pre 1 








1.00 55 52.66667 29 98026 75 35307 
90 70 68.44444 47 52631 89 36258 
80 90 84.22222 54 44077 104.00367 
70 100 100.00000 8061225 119.38775 
70 90 100.00000 80 61225 119.38775 
70 105 100.00000 8061225 119.38775 
70 80 100.00000 80.61225 119.38775 
65 110 107.88889 88.40197 127.37581 
60 125 115.77778 95 99633 135.55923 
60 115 11577778 95 90633 135.55923 
55 130 123.66667 103 40385 143.92949 
50 130 131.55556 11063742 152 47369 

120 2111111 -6 48250 48.70473 

1.10 36.88889 1193655 61.84123 
85 76.33333 56 07051 96.59615 
75 92.11111 7262419 111.59803 
45 139.44444 117 71277 161.17611 


每 一 价格 对 应 的 黄瓜 销量 分 别 为 : 
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表 8.5.2 个 体 预测 值 











实际 值 yo 与 其 预测 值 y. 之 间 有 预测 误差 yo 一 ,而 E Cy; — 0) —0, 
var(yo 一 70) 三 EE(yo 一 y0)* 二 E(yo 一 E(yo)? 十 EC(E(y。) 一 yo)*), 即 预测 误差 总 方 
3E Coi) — 随机 扰动 产生 的 方差 他) 十 抽样 误差 产生 的 方差 (o3, ) ,扰动 方差 是 我 们 
控制 之 外 的 ,而 预测 值 的 方差 可 通过 增加 样本 容量 来 减少 。 通 过 计算 可 知 

de (1-1 o") 
从 而 易 见 :如 果 要 降低 中 ,可 以 采取 如 下 措施 : 

(1) 增 大 样本 容量 n; 

(2) 增 大 样本 中 自 变量 的 分 散 性 ( 即 增 大 La); 

(3) 减 少 z 与 自 变量 样本 均值 之 间 的 距离 。 

前 面 两 个 结论 是 显然 的 ,它们 反映 了 总 体 回归 直线 的 估计 式 越 好 ,预测 误差 的 
方差 越 小 。 第 三 个 结论 使 人 感 兴趣 , 它 意味 着 对 于 接近 工 的 自 变量 值 来 说 ,所 作 
的 预测 要 比 对 距离 较 远 的 自 变量 值 更 好 。 即 我 们 可 以 凭借 着 某 些 经 验 和 信息 作出 
更 好 的 预测 ,而 经 验 的 范围 是 用 自 变量 的 样本 值 来 表示 的 ,这 个 范围 的 中 心 是 工 。 


2. 预测 区 间 
我 们 用 S RE o^ tb RT 8] oz 的 一 个 较 优良 的 估计 


Gi) 


1 
tese OE Y 
E-s (eL 


这 时 ,我 们 已 经 给 出 了 yv NO. cb Aii 3 — Nc, D, Aen). 


依 此 ,我 们 可 构造 一 个 区 间 , 这 个 区 间 将 以 某 个 确定 的 概率 包含 实际 值 yw 。 如 果 
给 定 这 个 概率 水 平 为 1 一 a, 则 可 以 得 到 
i 


E 1 
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于 是 ,y 的 1 一 a 预测 区 间 为 
Gro tg. Sp Yo ota ui Sp) 
即 以 1 一 a 的 概率 预测 y。 包 含 于 上 述 区 间 内 。 
例 8.5.2 承 例 8.5.1, 求 每 个 自 变 量 值 所 对 应 的 因 变 量 值 的 预测 区 间 。 


表 8.5.3 个 体 预测 区 间 




















z y 95 FR 95% ERR 
1.2 21.11 —6.48 48. 70 

lol 36. 88 11.93 61. 84 
0.85 76.33 56.07 96. 59 
0. 75 92.11 72.62 111.59 
0,45 139. 44 117. 71 161.17 


比如 ,价格 为 1. 1 元 / 斤 时 ,黄瓜 销售 量 的 95 96 (4 BUM DC] A C11. 93,61. 84), 
即 可 以 预测 在 价格 1. 1 元 / 斤 下 的 黄瓜 销量 为 12 斤 至 62 斤 之 间 ， 


8.6 多 元 回归 分 析 


通过 前 几 节 内 容 介 绍 ,我 们 已 经 明白 ,回归 分 析 是 对 客观 事物 数量 依存 关系 的 
分 析 , 广 泛 地 应 用 于 社会 经 济 现象 变量 之 间 的 影响 因素 和 关联 的 研究 。 同 时 ,几乎 
普及 应 用 的 Excel 软件 为 回归 分 析 的 求解 给 出 了 非常 方便 的 操作 过 程 ,这 样 便 为 
回归 分 析 的 实现 提供 了 强 有 力 的 保证 。 

由 于 客观 事物 的 联系 错综复杂 ,经 济 现象 的 变化 往往 受到 不 只 一 个 因素 的 影 
响 。 为 了 全 面 揭示 这 种 复杂 的 依存 关系 ,准确 地 测定 现象 之 间 的 数量 变动 ,提高 预 
测 的 准确 度 , 就 要 建立 多 元 回归 模型 进行 深入 、 系 统 的 分 析 。 

多 元 回归 模型 的 一 般 形 式 为 

y=atb x tbrecbbarde 
其 中 y 是 因 变 量 ; r, zs，…，, zi 为 个 自 变量 ;e HMI RD sas bis bzs s ba 
为 回归 参数 。 

我 们 对 因 变 量 和 所 有 自 变 量 进行 n 次 观测 ,得 到 样本 数据 (y;， xmas zn，…， 
Ta), i=1, 2, 7. ,并 假定 第 i 次 观测 的 随机 误差 为 e;, 上 且 e 服从 正 态 分 布 
NO, °), Elee)) 二 0(i 关 站 ,于 是 就 有 

Yı=atbiza Hbrxa He +Hbita +e, i=l, 2, +, n, et eniid N(0, o!) 
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根据 最 小 二 乘法 ,要 求 mingla, bis bes s bi) = min 1(y; 一 EC(y,))* ,由 微 积分 


求 极 值 方法 , 需 对 上 式 的 各 回归 系数 求 偏 导数 ,并 令 其 为 零 ,可 得 到 &A 十 1 元 线性 方 
程 组 ,其 解 即 为 回归 系数 a, bi. be sts bi 的 最 小 二 乘 估 计 值 4 bis bas rn b X 
样 就 得 到 多 元 经 验 回归 方程 
y—àbur Hbr thr 

与 一 元 回归 分 析 类 似 ,同样 可 对 回归 方程 进行 显著 性 检验 ,应 用 回归 方程 进行 预测 

上 述 经 验 回归 方程 的 计算 过 程 是 非常 复杂 的 ,我 们 必须 借助 Excel 软件 来 实 
现 ,下 面 我 们 结合 实例 进行 介绍 和 分 析 。 

例 8.6.1 某 住宅 小 区 附近 的 家 具 商 城 ,认为 住宅 销售 户 数 和 新 婚 对 数 这 两 
个 因素 对 家 具 的 销售 额 有 明显 的 作用 。 为 了 确定 该 商城 每 季度 家 具 的 进货 和 销 
售 , 他 们 对 全 市 各 个 小 区 家 上 有 具 店 收集 了 12 组 市 场 调查 资料 如 下 。 














表 8.6.1 

家 具 销 售 额 v (万 元 )| 住宅 销售 住户 r | 结婚 对 数 za 

214 | m | sz 
248 | 123 | 22 
397 239 25 
388 221 24 
415 248 23 
430 | 251 26 
374 | 232 25 
550 238 27 
455 254 34 
535 372 39 
454 247 41 
638 | 410 38 


其 中 , 因 变 量 y 为 季节 家 具 销 售 额 ,zi 为 住宅 销售 套数 ,z* 为 结婚 对 数 。 请 为 商城 
人 员 建 立 二 元 经 验 回归 方程 并 进行 统计 推断 。 

解 ”打开 SPSS 软件 ,建立 如 下 表 8. 6. 2 所 示 数 据 文件 ( 见 SPSS 数据 文件 例 
8.6.1)。 
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表 8.6.2 





SPSSAddins Graphs Utilities Yindor Help 
Reports , 
EI m ol pw > C] 


Tables 


Conpare Meuns 
General Linear Hodel 
Mixed Models 
Correlate 


Curve Estimation. 





Classify 
Data Radnntian 


, 
, 
, 
» 
» 
> 
» 
p Binary Logistic. 





图 8.6.1 
在 弹出 的 对 话 框 中 ,将 因 变 量 y 和 自 变 量 zx ，z* 分 别 放 入 相应 位 置 ,直接 运 
行 即 得 到 : 


表 8.6.3 Variables Entered/Removed* 






Method 





Variables Removed 





Model Variables Entered 





1 xs X Enter 








a All requested variables entered 


b Dependent Variable: Y 
表 8.6.4 Model Summary 





T 
Model Adjusted R Square | Std. Error of the Estimate 








R | R Square 








i] «e [|o me.] .799 53. 289 





a Predictors; (Constant), X2, Xi 
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表 8.6.5 ANOVA" 








Model Sum of Squares df | Mean Square F Sig. 
1 Regression 130006. 681 2 65003. 340 22.891 . 000* 
Residual 25556. 986 9 2839. 665 
Total 155563. 667 11 

















a Predictors; (Constant), Xz, X, 


b Dependent Variable; Y 


R 8.6.6 Coefficients* 



















Unstandardized | Standardized 
Model Coefficients Coefficients Sig. 
B  |Std. Error| Beta 
1 (Constant) | 89.965 | 68.020 1.323 | .219 
X, 1.440 | .279 .869 4.451 | .002 
X, 1.009 | 3.311 .061 .314 .761 





a Dependent Variable; Y 


由 此 可 知 ,所 求 二 元 经 验 回归 方程 
3 一 89. 965 十 1. 240, +1. 0392; 

并 且 当 结婚 对 数 保持 不 变 时 ,入 住户 每 增加 一 户 , 家 具 销 售 额 平均 可 增加 1. 240 万 
元 , 当 和 住户 数 保持 不 变 时 ,每 增加 一 对 新 婚 数 ,家 具 销 售 额 平均 增加 1:039 万 元 。 

对 输出 成 果 的 分 析 ,给 商城 人 员 制 定 销售 计划 有 很 好 的 指导 作用 。 如 了 解 到 
近期 20 对 夫妻 新 婚 ,150 套现 房 出 售 , 则 本 季度 商城 可 以 安排 ?一 89. 965 十 1. 240X 
150--1. 039 X 20— 296. 745 万 元 的 销售 额 。 

例 8.6.2 天 津 某 区 关于 “电脑 销售 量 、 人 均 收 入 和 电脑 平均 价格 ”的 调查 资 
料 如 下 。 


58.6.7 





年 份 : 电脑 销售 量 y( 台 ) | 人 均 收入 zx1( 元 /年 ) | 平均 价格 zz (元 / 台 ) 











1994 上 1040 | 5789.4 13420 
1994 F 1238 5989.8 12800 
1995 上 1895 7096.2 12210 


7396.6 





1995 F 2210 11400 
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续 表 8. 6.7 
Ef 电脑 销售 量 y( 台 ) | 人 均 收入 r (元 /年 ) | 平均 价格 z (元 / 台 ) 
1996 上 3823 8091.2 10860 
1996 下 5887 8275.3 10240 
1997 上 6795 8391.6 8581 
1997 下 8490 8575.7 7134 
1998 上 10610 8623.5 5600 











试 建立 电脑 销售 量 的 二 元 经 验 回归 方程 并 进行 统计 推断 。 
解 使 用 SPSS 软件 ,建立 数据 文件 ( 见 SPSS 数据 文件 例 8. 6. 2) 如 下 。 





调用 回归 分 析 程 序 , 在 弹出 的 对 话 框 中 ,将 因 变量 ”和 自 变 量 a, 分 别 放 
人 相应 位 置 , 直 接 运行 即 得 到 ， 


表 8.6.9 Variables Entered/Removed" 


Model Variables Entered Variables Removed Method 


. * | Enter 
a All requested variables entered 
b Dependent Variable; Y 

















表 8.6.10 Model Summary 





Model R R Square Adjusted R Square | Std. Error of the Estimate 








1 .986* . 972 .962 669. 226 














a Predictors; (Constant), X;. X, 
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表 8.6.11 ANOVA" 








Model Sum of Squares df Mean Square F Sig. 
1 Regression 92610496. 907 2 46305248, 453 103. 392 . 000° 
Residual 2687179. 093 6 447863. 182 
Total 95297676. 000 8 

















a Predictors: (Constant), X; X; 
b Dependent Variable; Y 


38.6.12. Coefficients" 





















Unstandardized 95% Confidence Interval for B 
Coefficients t Sig. Lower Bound Upper Bound 
B Std. Error 
(Constant) 16164. 890| 4889. 622 | 3. 306 | .016 4200. 417 28129. 364 
X; .1M7 .428 «345 | .742 一 ,900 1.195 




















—.801 





—1.661 





X: 


a Dependent Variable; Y 


由 此 可 知 ,电脑 销售 量 的 二 元 经 验 回归 方程 为 
37716164. 890 十 0. 1472, 一 1. 231z; 

判定 系数 R = 0.972 表明 ,在 电脑 销售 量 的 变化 中 ,有 97% 以 上 的 变 差 可 用 “人 
均 收 入 ”和 “电脑 平均 价格 ”的 变化 来 解释 ,只 有 不 到 3% 的 变 差 属于 还 得 不 到 解释 
的 随机 误差 。 估 计 标 准 误差 S = 669. 226,S 的 数值 越 小 ,表明 回归 方程 的 精度 越 
高 。 在 不 同 的 样本 容量 条 件 和 置信 概率 下 ,估计 标准 误差 S 可 决定 置信 区 间 的 宽 
度 。 

下 面 我 们 介绍 多 元 线性 回归 方程 的 显著 性 检验 。 

与 一 元 情形 相同 ,我 们 是 从 总 体 中 随机 抽取 一 个 样本 ,根据 样本 资料 导出 的 多 
元 线性 经 验 回归 方程 ,必须 经 过 显著 性 检验 , 方 可 对 总 体 作出 结论 ,确证 这 个 模型 
是 否 可 靠 和 具有 应 用 价值 。 通 常 的 做 法 有 : -检验 和 下 -检验 ,t -检验 是 对 偏 回 归 
SRI bi, bas rns be 做 显著 性 假设 检验 ,FF -检验 是 对 多 元 线性 回归 模型 做 整体 显 
著 性 的 检验 。 


1. -检验 
作 原 假设 H。: b=0 备 择 假设 Hi : 5,750 i 二 1, 2,… ,上 ,检验 统计 量 为 i 二 





第 8 章 ”相关 与 回归 分 析 219 





LT i=l, 2, wv RE PGG-—k—-D2 |t D 5 UIE 4 RBE B PA X Y A É 


变量 zx, 作用 是 显著 的 ;反之 , 则 接受 原 假设 ,认为 该 自 变 量 的 作用 是 不 显著 的 。 

当 我 们 利用 Excel 求 经 验 回归 方程 时 ,在 输出 成 果 中 就 已 经 有 了 这 些 检验 结 
论 。 如 对 于 前 面 的 例 8. 6. 2 来 说 ,从 输出 成 果 表 8. 6. 12 可 见 t = 0.345, t = 
—7.000, 对 检验 水 平 a=0. 05 ,* 户 - Value" 即 为 检验 统计 量 所 对 应 的 双 尾 概率 ， 
它们 分 别 是 “0. 742"“0. 000423”。 前 者 显著 地 大 于 0.025, 后 者 显著 小 于 0. 025 ， 
可 见 我 们 所 拟 合 的 二 元 线性 回归 方程 式 中 的 第 二 个 自 变量 (平均 价格 ) 的 作用 是 显 
著 的 ,但 是 第 一 个 自 变 量 ( 人 均 收 入 ) 的 影响 不 显著 。 事 实 上 ,1994 年 至 1998 年 ， 
人 均 收 入 的 增长 远 非 电脑 销售 增长 可 比 , 同 一 般 娱 乐 消费 用 的 电器 产品 不 同 , 并 非 
收入 水 平 的 提高 ,而 是 科技 的 迅速 发 展 和 人 们 的 工作 、 文 化、 教育 的 需求 促进 了 电 
脑 的 销售 ,还 有 销售 价格 的 降低 也 是 促进 因素 之 一 。 所 以 我 们 可 以 剔除 第 一 个 自 
变量 ,或 将 其 换 成 “人均 储 蕾 额 ” 试 作 考虑 。 


2. 下 -检验 


在 多 元 回归 模型 中 ,有 两 个 及 两 个 以 上 自 变量 ,回归 模型 的 整体 显著 性 是 不 能 
由 任何 一 个 偏 回归 系数 的 显著 性 所 能 替代 的 。 因 此 必须 采用 F -检验 来 判断 回归 
模型 整体 的 显著 性 。F -检验 的 原 假设 Ho :判定 系数 统计 量 的 真 值 等 于 零 ,检验 统 


xa bor. SSR/k T: P 
计量 是 F 一 SSE7OCA 1 ,利用 Excel 软件 ,求解 经 验 回 归 方程 时 ,在 输出 成 果 


中 的 方差 分 析 (ANOVA) ,就 是 这 一 检验 。 当 PCFC, n—=k—1)>F)<a 时 ,就 拒 
绝 原 假设 ,认为 已 建立 起 来 的 线性 回归 模型 整体 上 显著 有 效 。 

如 在 例 8. 6. 2 中 表 8. 6. 11, F= 103. 392, P(F(2,6) 77103. 392) 一 2. 242E — 05«& 
0.05, 所 以 认为 回归 方程 是 显著 有 效 的 。 

利用 SPSS 输出 成 果 ,我 们 还 可 写 出 回归 系数 的 置信 区 间 为 

itg, aa Sy o bit aa S) 

如 例 8. 6. 2 中 ,bi 的 置信 概率 95% 的 区 间 为 (一 0. 900.1. 195) b: 的 置信 概率 
95% ff EX [8] y C— 1. 661, —0. 801) ,由 这 些 指 标 我 们 可 以 在 置信 概率 为 95% 时 得 
到 两 个 包 络 平面 

Xi = 4200. 417 — 0. 900r, — 1. 661; 
Sz = 28129. 364 + 1. 195x, — 0. 801; 
可 以 断定 ,这 两 个 包 络 平 面 所 形成 的 空间 层 将 包含 了 95% 的 销售 量 数值 。 
最 后 ,我 们 对 多 元 线性 回归 模型 的 相关 分 析 作 个 介绍 。 
多 元 线性 回归 模型 中 的 两 个 或 多 个 自 变量 ,它们 组 合 在 一 起 同 因 变量 发 生 一 定 
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的 依存 关系 ,引起 因 变量 的 变化 。 同 时 ,各 个 自 变 量 又 是 相互 独立 的 (如 果 经 过 统计 
检验 认为 不 独立 , 则 回归 效果 可 能 会 变 差 , 须 另 作 研究 ) ,它们 同 因 变 量 的 依存 关系 的 
性 质 和 密切 程度 也 是 不 同 的 。 哪 些 是 主要 的 ,哪些 是 次 要 的 ? 要 解决 这 些 问题 ,就 需 
要 对 已 建立 的 多 元 回归 模型 进行 相关 分 析 , 即 复 相 关 分 析 和 偏 相关 分 析 。 

复 相关 是 指 一 个 因 变 量 同 多 个 自 变量 之 间 的 相关 关系 。 所 有 自 变量 共同 变化 
时 , 因 变 量 随 之 变化 ,其 相关 程度 也 可 以 用 复 相关 系数 来 测定 。 复 相关 系数 的 计算 
指标 为 RR, 即 上 述 介 绍 的 判定 系数 R 的 算术 平方 根 。 

复 相关 系数 除 表 明 所 有 自 变量 同 因 变 量 关系 的 密切 程度 外 , 同 判 定 系数 一 样 ， 
也 是 对 回归 模型 拟 合 优 度 的 测定 。 如 例 8. 6. 2 中 的 R = 0. 986, 表 明 “ 人 均 收 入 ” 
和 “平均 价格 "作为 一 个 整体 影响 因素 同 “电脑 销售 量 " 存 在 高 度 相 关 。 

偏 相关 是 指 多 元 回归 中 各 个 自 变量 在 其 它 自 变量 固定 不 变 时 ,单个 自 变量 同 
因 变 量 的 相关 关系 ,其 相关 程度 用 偏 回 归 系 数 测定 ( 偏 相 关系 数 的 计算 要 用 SPSS 
来 实现 )。 通 过 对 各 偏 相关 系数 进行 比较 ,可 知 某 一 个 自 变量 对 因 变量 的 “ 净 影 
响 "。 当 我 们 所 研究 的 客观 事物 本 质 上 属于 多 因素 影响 的 变量 时 ,用 多 元 回归 、 复 
相关 和 偏 相 关 分 析 更 为 真实 和 精确 。 


练习 8 
1 研究 含有 必需 氨基 酸 添 加 剂 的 某 种 饲料 的 营养 价值 时 ,用 大 白鼠 作 试验 获 


得 了 关于 进食 量 (z) 和 增 重 GO DI 数据 . 试 分 析 大 白鼠 的 进食 量 与 增 重 之 间 有 无 
相关 。 


鼠 号 进食 量 z (g) 增 重 >(g) 





820 165 





780 158 





720 130 





867 180 

















1 
2 
3 
4 
5 690 134 
6 
7 
8 
9 
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2. 计算 各 品牌 啤酒 受 欢 迎 度 和 口感 的 Spearman 秩 相关 系数 。 





品牌 编号 | 1 2 | 3 4 5 6 7 8 9 10 





E 


受 欢迎 程度 | 9 i | 3 6 8 í 7 10 | 2 
口感 | 8 2 5 4 7 9 1 6 10 3 


3. 某 公司 下 设 15 家 分 公司 ,每 家 分 公司 在 一 年 中 的 销售 额 zx, 广告 费 y 和 销 
售 人 员 数 量 < 如 下 表 , 试 进行 相关 性 分 析 。 
































bianhao 





4. 在 研究 我 国人 均 消费 水 平 的 问题 中 ,把 全 国人 均 消 费 金额 记 作 y( 元 ), 把 
人 均 国民 收入 记 为 CO. 我 们 收集 到 1981 一 1993 年 13 年 的 样本 数据 (x;，y;)， 
i 二 1，2,，…，13。 数 据 见 下 表 : 
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人 均 国民 人 均 消 费 
年 份 收入 (元 ) 金额 (元 ) P 人 均 国 民 人 均 消 费 
ZU 元 EN 3 
收入 (元 ) 金额 (元 ) 
1981 393.8 294 
1988 1068.8 643 
1982 419.14 267 
1989 1169.2 699 
1983 460. 86 289 
1990 1250.7 713 
1984 544.11 329 
1991 1429.5 803 
1985 668. 29 406 
1992 1725.9 947 
1986 737.73 451 


1993 2099.5 1148 
1987 859.97 513 





COD 画 散 点 图 ; 

(2) 用 OLS 法 求 出 回归 方程 ; 

D HH r t y 的 决定 系数 ; 

(4) 对 回归 方程 作 方差 分 析 ; 

(5) 求 出 随机 误差 6 的 方差 o 的 估计 值 ; 

(6) Aib B. a. 的 95% 的 区 间 估 计 ; 

CD 对 回归 方程 作 残 差 图 并 做 一 些 分 析 ; 

(8) 当 国民 收入 增长 1 元 时 ,用 于 消费 大 约 是 多 少 ; 

(9) 计算 人 均 国 民 收 入 2300 元 时 ,人 均 消 费 金 额 是 多 少 ; 

(10) 给 出 置信 水 平 为 95% 的 近似 预测 区 间 。 

5. 一 家 保险 公司 十 分 关心 其 总 公司 营业 部 加 班 的 程度 ,决定 认真 调查 一 下 现 
状 。 经 过 10 周 时 间 , 收 集 了 每 周 加 班 工作 时 间 和 签发 的 新 保单 数目 如 下 表 : 



























周 序 号 1 2 | 3 | 4 5 6 7 8 9 10 
RENNWENH | iiy 1070 | 550 | 480 | 920 |1350 | 325 | 670 |1215 
2G 
UE ERS FUSIUS | 1.0 | 3.0 | 4.5 | 1.5 | 3.0 | 5.0 
mp 

eL. 























试用 回归 分 析 方法 分 析 y 与 x 的 统计 关系 。 

6. 一 位 医院 管理 专家 声称 ,医院 里 全 日 制 雇员 的 数量 可 以 通过 医院 的 床位 数 
估计 出 来 ,床位 数 常用 来 度量 医院 的 规模 。 一 个 医疗 产品 企业 的 研究 人 员 决 定 建 
立 一 个 回归 模型 ,根据 床位 数 对 医院 的 全 日 制 雇员 数量 进行 预测 。 她 调查 了 12 家 
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医院 ,得 到 如 下 数据 。 数 据 按照 床位 数 的 多 少 排列 。 























床位 数 全 日 制 雇员 数量 床位 数 全 日 制 雇员 数量 
23 69 50 138 
29 95 54 178 
29 10 64 156 
35 118 66 184 
42 126 76 176 
46 125 Hl 78 225 














7. 一 家 公司 有 几 个 分 公司 。 公 司 的 战略 规划 人 员 认 为 广告 支出 费用 可 以 在 
一 定 程度 上 预测 总 销售 收入 。 为 了 辅助 完成 长 期 规划 ,她 从 几 个 分 公司 搜集 某 年 
销售 收入 和 广告 费 支出 的 数据 如 下 (单位 : 百 万 元 ) 。 


























广告 费 支出 销售 收入 
12.5 oj 148 
3.7 55 
21.6 338 
60. 0 994 
37.6 541 
6.1 89 
16. 8 126 
41.2 379 





建立 简单 回归 直线 的 方程 ,利用 这 些 数据 ,根据 广告 费 支出 对 销售 收入 进行 预 
测 。 

8. 对 下 面 的 残 差 绘图 ,根据 图 指出 回归 分 析 的 哪 一 个 基本 假定 可 能 被 违背 
T. n 
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工 3 一 了 T »-» 
10 5 m 一 3 
11 3 15 2 
12 -1 16 5 
13 -n 17 8 














9 分析 下 面 的 回归 分 析 的 SPSS 输出 结果 ,该 模型 是 根据 x( 距 消防 站 的 距 
离 ) 预 测 >( 火 灾 损失 ) 。 








Model Summary 
Adjusted 
Model R R Square Std. Error of the Estimate 
R Square 
1 .961* .923 .918 2.3163 
a Predictors; (Constant). 距 消防 站 距离 
ANOVA* 
Model Sum of Squares | df | Mean Square F Sig. 
1 Regression 841. 766 1 841. 766 156. 886 . 000^ 
Residual 69. 751 13 5. 365 
Total 911.517 14 





a 











b Dependent Variable: 火灾 损失 


Predictors; (Constant), 距 消 防 站 距离 


Coefficients* 





Unstandardized 





Standardized 



























Model Coelficients Coefficients| 1 | Sig. 
B Std. Error Beta 

1 (Constant) 10. 278 1.420 7.237| .000 

距 消 防 站 距离 .393 .000 





a 


Dependent Variable; 火灾 损失 
回答 下 列 问题 : 
(1) 回 归 模型 的 方程 是 什 
(2)z 的 系数 的 含义 是 什么 ? 


么 ? 
么 
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(3) 回 归 模 型 的 斜率 的 检验 结果 如 何 ? 

(4) 对 R Square 和 标准 误差 进行 评述 ; 

(5) 对 下 值 与 x f c 值 的 关系 进行 评述 。 

10. 研究 下 面 的 SPSS 多 元 回归 输出 结果 。 这 个 模型 中 有 几 个 预测 变量 ? JL 
个 观测 值 ? 回归 直线 的 方程 是 什么 ? 根据 正 值 讨论 模型 的 效果 。 哪 些 自 变 量 是 
不 显著 的 ? 为 什么 ”对 模型 的 整体 有 效 性 进行 评述 。 


Model Summary 
Model R R Square 










Adjusted 
R Square 
.981 


Std. Error of the Estimate 








131.237 


a Predictors: (Constant), 民航 航线 里 程 (万 公里 ), 铁路 客运 量 (万 人 ) ,国民 收入 ( 亿 元 


ANOVA” 










Sum of Squares F Sig. 













1 Regression 1. 4E+07 263. 922 .000* 


Residual 206677.3 





17223. 105 








Total 


a Predictors: (Constan) ,民航 航线 里 程 (万 公里 ). 铁路 客运 量 ( 万 人 ) ,国民 收入 ( 亿 元 ) 
b Dependent Variable: 民航 客运 量 ( 万 人 ) 


1.4E 十 07 





























Coefficients* 
Unstandardized Standardized 
Model Coefficients Coefficients t Sig. 
B Std. Error Beta 
1 — (Constant) —187.763 | 338.514 —. 555| . 589 
国民 收入 ( 亿 元 ) .085 .029 .589 2.895| .013 
铁路 客运 量 ( 万 人 ) 一 .001 .003 一 .013 |—.338| .741 
民航 航线 里 程 (万 公里 )】 16.703 | 8.178 E 2.042| . 064 





a Dependent Variable: 民航 客运 量 ( 万 人 ) 


11. 一 家 房地产 评估 公司 想 对 某 城市 的 房地产 销售 价格 y( 元 /平米 ) 与 地 产 
的 评估 价格 zi (万 元 ) .房产 的 评估 价格 zz (万 元 ) 和 使 用 面积 zi (平米 ) 建 立 一 个 
模型 ,以便 对 销售 价格 作出 合理 预测 。 为 此 ,收集 了 20 栋 住 宅 楼 的 房地产 评估 数 
据 : 


226 概率 统计 与 SPSS 应 用 








用 SPSS 进行 回归 分 析 , 回 答 下 面 的 问题 : 

(1) 这 20 栋 住 宅 楼 的 平均 销售 价格 ; 

(2) 计 算 销售 价格 y 与 地 产 估价 xi,y 与 房产 估价 x ,y 与 使 用 面积 zs 的 相关 
系数 ， 

(3) 在 销售 价格 y 的 总 变 差 中 ,被 zi ,zz ,zs 所 解释 的 比例 是 多 少 ? 

(4) 写 出 y 对 ni ers ers 的 回归 方程 ; 

(5) 检 验 回归 方程 是 否 显著 (c 一 0.05)? 为 什么 ? 写 出 检验 概 值 p。 

〈6) 检 验 各 回归 系数 是 否 显著 (ca 一 0.05)? 为 什么 ? 

(7) 你 对 模型 有 何 改进 建议 ?” 对 你 改进 的 依据 作出 必要 的 说 明 。 

(8) 当 地 产 估价 为 921 万 元 .房产 估价 为 3530 万 元 、 使 用 面积 13833 平米 时 ， 
对 销售 价格 .平均 销售 价格 作出 预测 (点 预测 和 区 间 预 测 ) 。 


练习 答案 与 提示 


5&2] 1.1 


1. Q— (GE E) GE JO OR iE) OR D): A= (E, E), E, 5)}; 
B-—(GE IE) OX B) 5;C-— {( 正 , 正 ),( 正 , 反 ),( 反 , 正 )}。 
Bd 10, (O2), u CLs DOr GPe D, (2, 2), voy (2,0), 5, 
(6,1), (6,2), 7. (6,60) 
AB={(1, D. (1, 3. (2.2), (3,1)}; 
A+B=4(1, 1), (1,3), (1,5), =+, (6,2), (6,4), (6,6), (1,2), 
Q.D 
AC—6; BC={(1, D. (2,2)}; 
A—B—C- D (01.5), (2.40, (2,604 (4,2), (4,604 (51104 (642). 
(6,4). 
3. (DABC; (2) ABC; 
G)AB C- AB C-- A BC; 
(4) ABC-- A BC-- ABC; 
(5) A+B+C; (6) ABC; 
(7) A B C+A BC+ABC+ABCRA B-AC- BC; 
(8) ABC (9) A+B+C. 
4. 甲 未 击 中 ; 乙 和 丙 至 少 一 人 击 中 ; 甲 和 乙 至 多 有 一 人 击 中 或 甲 和 乙 至 少 有 
一 人 未 击 中 : 甲 和 乙 都 未 击 中 : 甲 和 乙 击 中 而 再 未 击 中 ; 甲 、. 乙 ` 丙 三 人 至 少 有 二 人 
击 中 。 
5. 如 图 
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A+B+C=AB C+ABC+ABC+ABC+ABC +ABC+A BC; 
AB+C=ABC+C; 
B—AC-ABC-ABC-ABC-BA--ABC-BC-- ABC, 

6. 不 一 定 成 立 。 例 如 :A 二 {3, 4, 5) , B— (3) ,C— (4, 5) ,那么 A 十 C 


B+C ,但 是 A 去 B。 
7. 不 一 定 成 立 。 例 如 : A—(3, 4, 5), B={4, 5, 6) , C={6, 7) ,那么 


A 一 (8 一 C)={3) ,但 是 (A 一 B) 十 C={3, 6, 7}。 
练习 1.2 
1,1,3 
l. 2'9'89* 
3 
2. 8" 
3. PUD-POD- XO - di PD=PE =} p PPS E P«-2, 


lo 


P(H)= 
MTS 0.0588; (2) CC Cx 一 0. 0594; 每 次 拿 1 件 ， 


取 后 放 回 , 拿 3 次 :(1)0. 0576; (2)0. 0588; 每 次 拿 1 件 , 取 后 不 放 回 , 拿 3 次 : 








(1)0. 0588;(2)0. 0594. 
c i 
5. P(A, D=& =f: Pans c H $c PD- 1-&., 
^ 
..5PP—4Pi 41 
$OPCUPR C» 
AXI 4, CXC X1 
; 





7. (1-12 (5 
: B 125 125 
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15. 


16. 


. (1) 是 概率 分 布 ; (2) — 
Csa, 

. PIX=b =p- 0 , k=1, 2, = 

. (1) P(X—)) —0— pp, k=0, 1, 2, =; 








| po SICE+CIChCh 0 602 p CS CChChCh 
Ch C 
练习 1.3 
2, 2. i. 3. (1) 0. 862 (2) 0.058 (3) 0. 8285, 


.( 略 )。 5. ASPS, 6 ( 略 )。 7. OD. 8. 0.902, 
,系统 T: 加 (2 一 加 ); 系统 II: 加 (2 一 记 )"。 


CG.G 21 
Ch 0! 





3 
(1) (2) 10° 


. (1)0. 10034; (2)0. 0038. 

. (1) P= 二 Ci X0. 3* X0. 7* —0. 3087( 贝 努 里 试验 ); (220. 371( 条 件 概率 ) 。 
. (100.9, (250.887, 

. (1) €0. 94)"; (2) C20. 06)? (0, 94277 ; 


(3) 1—C; X0. 06 X (0. 94)^! — (0. 94)", 

CD 50— 5075; (2) Cia p 0O— 9*5 (3) C;p'Q— "7. 
(4) Crip (ips 

0. 458, 


(2 PCX 过 5) 三 DRX = k) = 0. 9° = 0.590, 
1 


“64° 


(1) 1 — 0. 99” — 20 X 0. 01 X 0. 99" 22 0.0175( 按 Poisson 分 布 近似 )， 
(2)n = 100, np = 100 X 0.01 = 1 = à (4€ Poisson 分 布 近 似 )， 
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POCZ NoD 一 > Cla X 0. 01* x 0. 99% 


eNi 





"Wm 
e» EX coo 








E II 
查 表 得 N —4. 
5. Masin: (2) P(X >>D 一 1 一 去 一 去 In2。 
8. e^, 
9. (D e*t; (2) 1—e7*, 
1.0) a = Li (D 如 下 表 
X | =? 0 3 
3 1 3 1 
d 16 * 16 * 
练习 2.3 
YE - 
2^*7* r€[-1.0) 
LO» t=- 1; (2) f) =4_1 ,1 ! 
gg TELD 
0. xu 





2. (D) a = £, P(X> 


2 
L 
3. —e*. 
Vx 
4. 472,0 —3, C—2, 


iyd 
5 FY-2-g. 


1 lis 
6. O Gs D: (D 76 n2. 
rt b .—0, 14 2, 3. 4. 5; 





7.00 PY = k) = Cte? (1—e 
D PYS 
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练习 2.4 
0， xz<1 
0.2, I z«2 
1. FG) = ^77 p(scX«2-0.5 
0.5, 2«&z«85 
l, r>3 
fG) 
1 
0.5 ——o 
0.2| —o 
dp d 
o 1 2 3 
2. (1) 如 下 表 ; o2, 
Xx | -1 1 3 
p» | 0.4 0.4 0.2 
3. (1) 如 下 表 : 
X | 0 1 2 3 
P 27 54 36 8 
125 125 125 125 
0,  zr«0 
27 
125" DE e Leid 
(2) Fry) = dL igat? 
Jr T0 
117 
ps ?&-«3 
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0. ael 
l2 1 1 
redu iE —YL€ x 





2 
5. (DA-1, B =—1; (2 1— e; (f(x) = | 


6 .a—0,b5—1,c——1l.d-l. 


7. a= lj Fx) = T Larctanz s PA XI|<1)=0.5。 
z 


1 一 eer， 
8. D POC 0 = PING) = 0) = e ^" f FG) = | 


(2) F(3) = 0.26; (3) F(5) — F(3) = 0.13, 
9. (150. 8051; (2)0. 5498; (3)0. 6678; (4)0. 8253, 
10. 79.6 分 。 11. OR. 


=d] 1 1y—4di 
n nol jy se 





0, 其 它 
-i 

当 c 之 0 时 ,有 fro) = [cer 
0. Ku 


1 
Mc OU fro) -| cO —a)' 
0, 其 它 


r>0 
r<0 
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—1 0 1 b. 
Xx 
SENEE 
1 0 4 0 T 
JER WEE 


练习 3.1 
1l. 
0 1 bp. i 0 1 Pi 
X X 
4 6 10 2 4 6 
E 35 — 35 | 35 2 15 15 | 15 
1 £ 9 | 丐 1 4 5 | 2 
25 25 25 15 15 15 
10 15 6 9 
bs 25 25 1 b» 25 25 1 
有 放 回 的 情形 无 放 回 的 情形 
2. 
0 1 2 b. 
X 
zl. l 1 l 
120 20 40 12 
1 1 1 1|5$ 
8 4 24 12 
1 1 5 
? rS d i 
1 1 
3 12 0 0 Imi 
3. (0D 
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(2 P(X =Y) 一 0。 





.U 与 V 的 联合 概率 分 布 见 下 表 


(DA=2; (D co-[5' fo! o ej. 
: aii AEA ES gao 0, 
D ü—-e*ü-e69; 001—265: G) d. 
224i, 0z«1 
. GD) f(z) = 3 
0, 其 它 
l.l, o<y<2 
fao =43 6 
0, 其 它 
5 
o $. 
z, 0 ^ 0 
. (1) filz) = r vm &Royelm e xe 
0, z«0 0, y«o 
(2) e€*—3e*, 
. 提示 :利用 二 维 均匀 分 布 计算 得 。 
练习 3.2 
aO 
X | =] 0 1 
P | 0.1344 0.7312 0.1344 











练习 答案 与 提示 





ü—e7)ü—e?), xz>0y>0 
0, 其 它 
0 Zz<0 或 y><0 


4. F(x, y) = 


Frya) o<r<1,0<y<2 
Rimpa isGrxn Ocrclyz2 


ly4ky — z210«yc 
12 


zl yS 
0, r«05y-o 
F(x,y)—41—e*—ze", Oxcr«y 
l—6€*—338*; 0<y<r 
0, I<0 或 y<0 
zy, 0<zr<1,0<y<l1 
5. Fix, y)—4 ws Ocr-cl.yzl 
y» z>1,0<y<1 
l, z>l,y>1 

0, z<0 





lo em 
6 (DA-21 (Dfíü524207*?» 0&z«? 


e-n, i22 


=L Becat ad s da i 
7 WDA- B-C- ja fy r Foy’ 





bui z zd 4 x. 
(3) FxG) = y Hartan $, FyG) = 5 + rarctan i 





E 3 = 4 
hn rT 0 730 pg 
3 3 9 
D Tog (5) 和 与 了 相互 独立 。 
I= rnk, 0 二 本 ov 0 
8. (1) Fx(z) = | d ub ASE E aem 
0, r«o 0, yxo 
0. 25e 9566», 0, y>0 
€ fa, » - | e ATENA 
0, 其 它 
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六 Cn avt r0 AG 0.5e ^5, 
j= - 
- 0, peg ^ 0, 


G) X 与 了 相互 独立 ; 
(4) e™' (zz 0.9048), 
e z>0,y>0 


9. (1) f(x, y) 
fiz, y 6, 其 它 





1—e)0—e*), 0, y>0 
Fæ, » =| E €)» ax) yx 
0, 其 它 
(2 (1 一 ea)(1 一 e); (3) 1—4e?, 
5 4 
1. 2.2. 
a-z), 0<z<1 
11. no -| i I 
0, 其 它 
练习 3.3 
1. 
Y|X22 











` 0cy« 
1osoon. fola cd oem 


0, y«0Uyzzc 


1 
3. scisco» - [I5 


0, 
练习 4.1 
1. E(X) — 0.5, EO — 0.5, 
2. DOO = Å, D(X) = £r. 


3. zr, = 21, a = 0.2. 


aja 


，|lyl<zr<1 


其 它 


2 二 0 
y<0 
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4a b Dt p IF m PATRA ma — mb (1 — p) o 


5, k—3,a—2. 





6. EOD — 1, DOO = t. 

i 
7 B -?te ph = E 
o [4 


8. OD E(X) =2, D(X) —4. (2)c 一 1, E(X) = 4, 


9. D(XY) = 27, 
10. E(X) = 270, D(X) = 225, 
11. 0, 1, +, 9; P(X <8) = 0.9999, 


n fp 
12. 240 * 9a TO). 


13. a = 12, b — 12, c — 8, 
14. ECXY) = 4, 

. l, imm 

15. 提示 : f(z) 二 43 
0, 其 它 

PY =—1) = P(X <0) = 4, PY = 0 = 0, DY) = È, 

16. 提示 : 设 每 周 的 产量 为 N, 显 然 N <5 AN 

: (cz 一 ct)N， eid 6N, Q>N 
GaQ—aN—a(NN-Q, Q«N ll0Q—4N, Q«N 

ECL) = 6N - P(Q > N) + (10Q— 4N) + PQ N) 


si " E 
-6N 3103. L-iN- Md 


<2 2 
GURPY-D-PXL0-2, 





一 和 NG 一 N) 十 2 LEN QNIN 
-IN-N 
P-EL) —7—2N — 0 N — 3.5. URS EUL) ——2 «0, ,所 以 当 N 一 


3.5 时 , ECON) 达到 最 大 值 。 
由 于 Q@ 和 NN 均 取 正 整数 ,所 以 应 取 N 二 3 或 N = 4, 故 当 产 量 为 3 件 或 4 件 
时 ,利润 达到 最 大 期 望 值 12 元 。 


. P(400 < X < 600 > 2. 
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18. 提示 : 先 猜 A 类 题 的 期 望 为 
0X (1— p) c ap( — p) + (la +b) fq s 
先 猜 B 类 题 的 期 望 为 
0X (1— Q) +aq(1—q) + Xa 4- bap 
IR ap — p) 过 如 (1 一 9), 则 应 先 猜 A 类 题 ,否则 先 猜 B 类 题 。 
19. 2, 


20. sp - (8)*]. 
练习 4.2 


1. OD 0, 0, CF, È 40D cov(X，Y) =0, pr =0; (3) XX 与 Y 不 相关 ， 
但 也 不 独立 。 


2 (DD C= 8 (00 G^ 8 


2 1n 
j^ 


75' 225 
4 — 2 V66 
225' pw 33 
3. D(X +Y) = 85, D(X — Y) = 37。 


( s 


(3) cov(X, Y) = 





;(4) X S Y 相关, 不 独立 。 





4. p = 士 pw。 
5. EO = 4, D(Y) = 18, cov( X, Y) = 6, pw = 1. 
6 EV =4, DV = 2, ox, = 了 ,or = T fS. 
7. penn m Se 
8 ael, b= ey ra dme b= n en 
9. PU X4Y [26 « i. 

练习 4.3 


1. P(X > 102) ~ 0.0228 
2. P(180 < X < 220) ~ 0. 8764 
3. 提示 :假设 第 i 个 加 数 的 取 整 误差 为 X;(i — l, 2, s n), 则 EX) = 0, 
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2l Aimy k - 2E E 
D(X;) =i? S. = 21X Min BEKR, S, ~ N(0, 12:0? 0.0026; (2) n 


446. 16, n = 446; (3) [~ 14. 85, 14. 85]. 

4. PCT > 360) = 0.1367, 

5. P(X >10) = 0.045 

6. (1) n > 5250 ;(2) n > 1423.5 

7. 提示 : X 为 一 年 内 死亡 的 人 数 , X 一 B0000, 0. 006) ,公司 利润 为 Y = 
10000 x 12 一 1000X。(1) 约 为 0; (2) 约 为 0.5。 

8. 2265 单位 

9. n — MT, 


练习 5.1 


1. 0, 0.01, 0.5, 0. 8414 
2. 106 3. 5.43 4. 0.95 5. 26.105 
6. 0.6826, 0. 8426, 0. 90 


od 这 
7.0.1 8 B 9.Fü.m 10. gis ie 
11. y 
12. (9) — 15. F(10, 5) 16. F5, n—5) 
练习 5.2 


3. fia = FX t AH XGA 


4. 2.68 5. 1143. 75, 96.06 








6. a = 一 一 一 至 
mcn mcn 
2&2] 5.3 
1. (4. 412, 5. 588) 
2. (D457. 50 © (432. 30, 482. 70) 
图 (438. 90, 476. 09) (1240. 28 


(& ( 586. 79 , 4134.26 ) (& 35. 2176 
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QD ( 24.2237 , 64.2982 ) 
NEC 
3. [S 8 en 4. De^* @(-0.98,0.98)  @ (e"*, e^) 


5. (3.42,8.58) 
6. (D (0. 03822,1. 635265) Q (— 0. 387, 0.427) 


练习 5.4 


1. 0 fo fih Ô, æ ix, Ô, 不 是 9 的 无 偏 估 计量 ; 0 的 最 大 似 然 估 计量 
X) = LDX. D 是 0 的 无 偏 估计 量 。 
2à- lYwx.z - lanx, =W. WX EQO = etti , BEL EQO = 
e e 


e. CK DUAT TEN ent. 

3. OD 因为 E(X) = DOO — 0. 所 以 0 的 矩 估 计量 有 三 个 : 8 = X, ô = Bi. 
à, = S; 

(2) 0 的 最 大 似 然 估 计量 为 = X; 

(3) å = X 6; = S! 均 为 9 的 无 偏 估 计量 . 


练习 6.2 


L $ 0D D, 2. 能 认为 这 批 钢 索 的 断裂 强度 为 800 (千克 力 / 平方 厘米 ) 


3. 可 以 认为 机 器 工作 是 正常 的 。 4. 能 。 
s. 没有 显著 变化 。 6. 工作 不 正常 。 


练习 6.3 


1. 首先 检验 两 正 态 总 体 的 方差 是 否 相等 ， 再 检验 乙 总 体 的 均值 是 否 比 甲 总 
体 的 均值 大 . 通过 双 侧 检验 , 可 认为 两 总 体 的 方差 是 相等 的 ; 通过 单 侧 检验 , 认 
为 采用 乙方 案 可 以 比 甲 方案 提高 得 率 。 

2. (1) 方差 相等 ; (2) 均值 不 相等 。 

3. 注意 训练 前 后 的 分 数 是 不 独立 的 , 应 该 使 用 成 对 数据 比较 检验 法 , 通过 检 
验 , 认为 体能 训练 效果 不 显著 。 


